Проектирование базы знаний для биотехнической системы лечения и диагностики заболеваний легких

В настоящее время большие объемы медицинских данных собираются и хранятся в электронном виде. Хранение медицинских данных, таких как персональные данные, такие как снимки компьютерного томографа, может быть выполнено несколькими способами.

Можно хранить снимки КТ в виде файлов в определенной структуре каталогов. Однако этот тип решения не подходит для хранения медицинских данных, так как медицинские данные требуют больше метаданных, помимо имени файла. Обычно используемый метод хранения данных это баз данных. Можно извлекать, вставлять или удалять данные с использованием системы управления базами данных (СУБД). СУБД заботится о согласованности данных. Использование базы данных позволяет более эффективно обмениваться данными между исследователями и / или больницами. Речь идет о базе данных, которая содержит электронные медицинские данные, в качестве медицинской базы данных.

Медицинские базы данных различаются по размеру, назначению и использованию. Они варьируются от небольших баз данных, расположенных в отделении больницы, где хранятся диагнозы, до национальных систем медицинских записей и всего, что между ними. Некоторые базы данных содержат информацию о пациенте, такую как имя пациента, другие содержат только анонимную информацию, используемую для статистических целей или исследований.

MeDIA (сокращение от Medical Data Integration Application) - название системы управления медицинской базой данных, которая в настоящее время разрабатывается. Сенсорные данные, которые MeDIA может хранить, включают в себя ЭЭГ,

МРТ или КТ вместе с соответствующими метаданными, такими как информация о пациенте и аннотации. Основное преимущество MeDIA перед простым хранением двоичных данных заключается в том, что MeDIA обрабатывает происхождение, неопределенность, управление версиями и может комбинировать различные типы данных, например, ЭЭГ и МРТ.

Кроме того, когда кто-то хочет просмотреть данные ЭЭГ и МРТ от одного пациента, он может запросить MeDIA вместо того, чтобы запрашивать разные базы данных по отдельности. Существует три функции: происхождение, неопределенность и управление версиями, которые отличают MeDIA от обычных электронных систем медицинской документации.

Происхождение используется, чтобы показать, откуда происходит конкретный элемент данных. Например, если есть элементы данных a, b, с и с, определены как с = a + b, с выводится из а и b. Это может быть использовано, например, в диагностической таблице. Каждый диагноз перечисляет сенсорные данные, на которых он основан. Если по какой-то причине определенный набор сенсорных данных должен быть отклонен из-за неправильной записи, легко определить, какой диагноз необходимо пересмотреть.

Неопределенность в базе данных означает, что к элементам в базе данных прикреплена определенная вероятность.

Управление версиями - это возможность отслеживать предыдущие версии элементов данных. Например, предположим, что медицинское учреждение хранит информацию о пациентах в базе данных. Используя управление версиями, старые данные архивируются, а текущие обновляются. База данных, таким образом, хранит текущую и актуальную информацию о пациента, так и предыдущие данные, в том числе данные о более ранних обследованиях.

MeDIA состоит из нескольких компонентов, таких как интерфейс прикладного программиста (API) и экстракторы функций. На рисунке 2.4 показан дизайн MeDIA. Программное обеспечение пользователя связывается с системой через API.

Рисунок 2.4 - Компоненты MeDIA

MeDIA заботится о хранении сенсорных данных, таких как значения ЭЭГ, извлечение функций и повышение безопасности (например, шифрование конфиденциальных данных). Экстракторы элементов извлекают шаблоны или элементы, которые могут, например, разрешить отклонение артефактов, из необработанных данных.

Вся дополнительная информация, генерируемая компонентами MeDIA, хранится в базе данных Meta. MeDIA API преобразует запросы пользовательского приложения в запросы к метаданным и файлам данных. Запросы к API написаны на языке MediQL. MeDIA преобразует этот запрос в подзапросах к различным базам данных, которые могут быть SQL, XQuery или, в случае, когда сенсорные данные хранятся в обычных файлах, вызовами файловой системы.

Топология базы данных и рабочих станций показана на рисунке 2.3. Больница имеет внутреннюю сеть, которая обозначена на рисунке серым фоном. Брандмауэр фильтрует весь трафик Интернета. Брандмауэр настроен таким образом, что он не разрешает входящие соединения из Интернета с базой данных. Поэтому доступ к базе данных ограничен любой рабочей станцией в сети больницы. Это может считаться хорошей практикой, поскольку это может смягчить некоторые атаки со стороны узлов вне сети, например, при атаке на уязвимое программное обеспечение, работающее на серверах больницы. Однако, поскольку в самой больничной сети много компьютеров, все еще есть возможность атаковать базу данных. Можно заразить рабочую станцию в сети вирусом, например, с помощью фишинг-атаки, получив таким образом доступ к сети и, таким образом, минуя брандмауэр. Показания КТ, аннотации к этим показаниям и информация о пациенте были отправлены на запись КТ. База данных доступна только из сети больницы, и, как было указано ранее, брандмауэр применяет эту политику. Контроль доступа к базе данных осуществляется с использованием учетных данных. Эти учетные данные предоставляются только выбранной группе сотрудников. В этой ситуации есть системный администратор, который предоставляет доступ (другим) сотрудникам, поэтому сам администратор может получить доступ к базе данных. В базе данных все данные, включая информацию о пациенте, хранятся без какой-либо формы шифрования. Контроль доступа, основанный на учетных данных, позволяет только определенным сотрудникам получать доступ к данным и обеспечивается только базой данных.

Насколько известно, доступ предоставляется ко всей таблице, а не к определенному набору записей (строк). На рисунке 2.5 каждая рабочая станция представляет пользователя, подключенного к сети. Пользователь может быть врачом, медсестрой или другим лицом, например, администратором. Пользователи подключаются к базе данных по сети и, если им предоставлен доступ с их учетными данными, выполняют запросы.

Рисунок 2.5 - Топология медицинской базы данных

Стоит отметить, есть две важные особенности, которые могут определять успех или неудачу информационной системы здравоохранения. Первый связан с существованием общего словаря общепринятых терминов для всех медицинских понятий или административных данных, используемых системой применительно к любому пациенту. Второе относится к способности системы предоставлять конкретную информацию для каждого приложения, не ставя под угрозу интеграцию центральной базы данных. Это требование действительно для любой системы планирования ресурсов предприятия (то есть интегрированной системы деловой информации), но в сфере здравоохранения оно имеет особое значение. Фактически, обилие неструктурированных и / или неинтегрированных данных, по -видимому, является одной из наиболее важных проблем информационных систем здравоохранения. Трехуровневая архитектура ANSI / SPARC [8] обеспечивает хорошую иллюстрацию этого вопроса, выявляя три различных представления о данных: внутреннее

или физическое представление, концептуальное представление, и представление пользователя - рисунок 2.6.

Рисунок 2.6 - Трехуровневая архитектура

Основная задача при проектировании базы данных состоит в том, чтобы предоставить необходимые данные в любом представлении пользователю, но при этом избежать фрагментации представления сообщества.

Таким образом, предлагается создать на концептуальном уровне системы общий каталог «стандартных элементов данных», к которому будут обращаться все приложения (т. е. пользовательские представления системы). Однако каждому представлению пользователя необходимо структурировать эти элементы данных определенным образом (например, все различные «стандартные файлы пациентов»). Для обеспечения необходимой гибкости системы, то есть возможности определения любого стандартного файла пациента без изменений в структуре базы данных, был создан открытый каталог «тип файла» и средства для динамического построения конкретной иерархической структуры каждого из них. Тип файла объявлен в каталоге. Каждый узел в этих структурах должен представлять собой стандартные элементы данных, ранее опре-

деленные в каталоге «стандартный элемент данных» - рисунок 2.5. Наконец, фактические файлы пациентов, которые фактически представляют собой транзакции системы (т. е. записи данных в системе, которая документирует основные операции), генерируются динамически на основе их соответствующего определения «тип файла пациента».

Рисунок 2.7 - Диаграмма уровня сущностей базы данных

Изображение высокого уровня описанных сущностей представлено на рисунке

2.7. После заполнения сущности, идет взаимосвязь сущностей, которая представлена на рисунке 2.8.

Рисунок 2.8 - Диаграмма атрибутного уровня базы данных

Хотя имена атрибутов на диаграмме, как правило, не требуют пояснений, важно подчеркнуть компактный дизайн иерархической структуры стандартного файла пациента. Таблица «Std_Patient_File» позволяет определять любое количество древовидных структур, по одной на каждый «File_Type». Когда определенный файл должен быть заполнен для пациента, система автоматически сгенерирует его струк-

туру на основе стандартной структуры, найденной в таблице «Std_Patient_File», просто применяя фильтр к интересующему «File_Type_ID».

Другая сущность, для которой требуется краткое описание - это Item_Option_List. С помощью этой таблицы предлагается конечному пользователю (то есть врачу-специалисту) средства для объявления предварительно определенных значений для стандартного элемента данных. Таким образом, помимо чисел, текста, дат или рисунков, элемент данных может принимать в определенном файле пациента предопределенное значение из своего собственного «option_list». Это имеет особое значение для статистического анализа исследований. Описанная схема базы данных обеспечивает гибкую модель для построения иерархических структур данных, которые могут применяться не только для структурирования входных данных системы, но и для создания специальных данных, которые перегруппируют отчеты для исследовательских целей. Данные из разных стандартных входных файлов. Это представляет собой ценный инструмент для интеллектуального анализа исторических данных. Однако любой инструмент извлечения данных бесполезен, если общий словарный запас не обновляется с течением времени. Вот почему объект «Std_Item» нуждается в расширении, которое позволит связывать два или более элементов данных, как разные термины, которые описывают одну и ту же концепцию. Таким образом, медицинские бригады смогут поддерживать семантическую линию данных терминов, содержащихся в общем словаре с течением времени. Это рассматривается как обязательное расширение предлагаемого шаблона проектирования, особенно для крупных интегрированных информационных систем здравоохранения. Другим возможным расширением в будущем может стать предоставление конечному пользователю более сложных запросов, т. е. возможность выражать условия фильтрации, связанные в любой последовательности с помощью AND и OR. Это может быть выполнено с использованием того же механизма структурирования, который используется для стандартных файлов данных. Таким образом, один и тот же иерархический

шаблон может служить двум различным целям, связанным с динамическим построением пользовательских отчетов с данными:

1. Для указания содержимого отчета аналогично созданию стандартных входных файлов;

2. Чтобы указать условия фильтрации отчета, в настраиваемой последовательности логических соединителей (например, и, или, нет). Это было бы возможно, например, путем определения стандартных типов элементов специального назначения (в виде записей таблицы Std_item_type), по одному для каждого логического соединителя. По соглашению, когда фильтр данных указывается в виде иерархической структуры, все дочерние элементы одного из этих узлов будут связаны соответствующим логическим соединителем. Таким образом, пользователь сможет создавать сложные условные выражения, которые также могут быть сохранены в качестве пользовательских фильтров данных, просто сохранив их иерархическую структуру в таблице, как «Std_patient_file».

Предоставляя возможность медицинским специалистам определять новые стандартные файлы пациентов без вмешательства ИТ-специалистов, предлагаемый шаблон проектирования базы данных обеспечивает высокую степень масштабируемости для внешнего уровня системы - рисунок 2.3. Таким образом, каждая команда врачей может создать свое собственное «представление» о системе, которое лучше всего подходит для некоторых конкретных исследовательских или административных целей. В то же время интеграция базы данных на концептуальном уровне сохраняется независимо от количества новых внешних представлений, определенных пользователями. По этим причинам рассматривается предложенный шаблон проектирования, как жизнеспособное решение для разработки масштабируемых интегрированных информационных систем, в том числе и для диагностики заболеваний легких.

<< | >>

↑

Источник: Васильченко Владислав Алексеевич. ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕССОВ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ В РАМКАХ БИОТЕХНИЧЕСКОЙ СИСТЕМЫ ДИАГНОСТИКИ И ЛЕЧЕНИЯ ПУЛЬМОНОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ. Диссертация на соискание ученой степени кандидата технических наук. Воронеж - 2019. 2019

Еще по теме Проектирование базы знаний для биотехнической системы лечения и диагностики заболеваний легких:

- Приборы, системы и изделия медицинского назначения -

- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -