Факторы, определяющие чувствительность и специфичность
Нередко новый диагностический тест, который поначалу вызывает восторг, по мере накопления опыта оказывается далеко не таким эффективным, как это казалось. Достаточно вспомнить, как угас энтузиазм по поводу клинической ценности определения сывороточного карциноэмбрионального антигена (КЭА).
Сразу после открытия КЭА, его определение рассматривали как многообещающий метод диагностики рака толстой кишки. Однако позднее оказалось, что уровень КЭА повышен при многих других заболеваниях, а также примерно у 20% курящих людей без злокачественных новообразований. Подобное разочарование вслед за энтузиазмом порождается не недобросовестностью авторов, выполнивших начальные исследования, и не последующим несправедливым скептицизмом медицинской общественности. Скорее, это обус-ловлено ограниченными возможностями методов, с помощью которых оценивались характеристики нового теста. В простейшем случае, характеристики диагностического теста (например, чувствительности и специфичности) могут быть оценены неточно по причине выбора неверного стандарта для сравнения, что обсуждалось выше. Следует назвать еще три фактора, существенно влияющих на оценку как чувствительности, так и специфичности. Это разброс характеристик пациентов, которым проводился тест, систематическая ошибка при оценке характеристик теста и, наконец, случайная ошибка.
Характеристики пациентов
Трудности возникают, если характеристики пациентов, отобранных для участия в исследовании по оценке теста, отличаются от характеристик пациентов той группы, в которой этот тест будет применяться в клинической практике. Раньше тесты часто оценивались путем сравнения результатов, полученных на явно больных и на заведомо здоровых людях (например, на добровольцах, отобранных из студентов-медиков). Понятно, что изучаемый тест прекрасно дифференцирует эти крайние группы.
Однако следует учитывать, что даже пациенты с заболеванием, для диагностики которого тест предназначен, различаются по тяжести, стадии или длительности заболевания, а чувствительность теста выше у более тяжелых больных.
Пример. На рис. 3.6 показано, что эффективность теста КЭА неодинакова при разных стадиях рака толстой кишки. Тест КЭА высокоэффективен при метастазировании опухоли, но не в начальных стадиях заболевания. Таким образом, чувствительность теста для диагностики рака толстой кишки зависит от состава больных с различными стадиями заболевания в той группе, в которой производилась оценка характеристик теста, а стабильность этой оценки повышается, если в группу вошли больные с одной и той же стадией болезни [6].
Точно так же, по каким-то причинам тест может оказаться положительным у лиц, у которых лишь предполагается интересующее нас заболевание, но в действительности оно отсутствует. Это приведет к увеличению частоты ложноположительных результатов и снижению специфичности теста. Например, уровень КЭА повышен у многих больных язвенным колитом или циррозом печени. Если при оценке эффективности теста КЭА для выявления рака толстой кишки такие больные будут включены в группу "без заболевания", то увеличится число ложноположительных заключений и специфичность теста снизится.
Рис. 3.6. Характеристическая кривая теста КЭА для диагностики рака толстой кишки на разных стадиях заболевания Чувствительность и специфичность теста меняются в зависимости от стадии заболевания [Fletcher R H Ann Intern Med 1986,104 66 -73]
Теоретически чувствительность и специфичность не должны зависеть от распространенности заболевания в выборке, в которой производится оценка теста (см. рис. 3.2). Однако на практике происходит иначе: как уже отмечалось, чувствительность и специфичность теста могут быть различными, в зависимости от стадии и степени тяжести заболевания у больных, входящих в группу, по которой оценивается эффективность теста. Встречаемость же больных с разной выраженностью заболевания в выборке может быть различной. Это подтверждается при использовании скрининговых тестов (более подробно скрининг обсуждается в главе 8). Скрининг представляет собой обследование популяции, в которой отсутствуют проявления заболевания; распространенность заболевания обычно низкая и у пациентов в основном наблюдаются ранние стадии и менее тяжелые формы болезни.
В подобных условиях наблюдается тенденция к более низкой чувствительности и более высокой специфичности, чем в случае применения того же теста у предположительно больных, поскольку у многих из них болезнь значительно выражена.
Систематическая ошибка
Иногда чувствительность и специфичность теста оцениваются с учетом данных, которые были использованы для постановки истинного диагноза, что приводит к смещенным оценкам характеристик теста. Этому может быть несколько причин. Как уже указывалось, если тест оценивается по данным, полученным в ходе клинического обследования пациентов с подозрением на изучаемое заболевание, то положительный результат теста может побудить врача к продолжению диагностического поиска, что увеличивает возможность выявления заболевания. И наоборот, отрицательный результат может привести к отказу от дальнейшего обследования, что увеличивает вероятность невыявления заболевания, если даже оно имеется.
В других случаях результат теста может стать частью информации, используемой для постановки диагноза, либо наоборот, результаты теста интерпретируются с учетом окончательного диагноза или других клинических данных. Такого рода систематические ошибки часто возникают при интерпретации рентгенограмм, поскольку этот процесс во многом субъективен и, вследствие этого, подвержен влиянию дополнительной клинической информации. Всем врачам знакома ситуация, когда с учетом клинических данных ошибочно выявляется патология на рентгенограмме или же когда при обращении к старым рентгенограммам на них находят то, что ранее пропустили, поскольку в отсутствие соответствующих клинических признаков не обратили должного внимания на определенную область снимка. Во избежание таких смещенных оценок некоторые рентгенологи предпочитают изучать снимок дважды: первый раз - не имея клинической информации, второй раз - располагая ею. Все эти смещения оценки приводят к повышению соответствия между исследуемым и стандартным тестами, т.е. тест кажется более информативным, чем на самом деле.
Примером служит приведенная в начале главы ситуация с диагностикой грыжи межпозвоночного диска с помощью MPT у пациентов с жалобами на боли в спине.Случайная ошибка
Значения чувствительности и специфичности (или отношения правдоподобия - другой характеристики диагностических тестов, рассматриваемой ниже) обычно оцениваются путем наблюдений в сравнительно малых группах лиц с изучаемым заболеванием и без него. Вследствие случайных вариаций в любой выборке, особенно малой, чувствительность и специфичность теста могут искажаться, даже если в исследовании отсутствует системати
ческая ошибка. Наблюдаемые значения соответствуют истинным значениям в диапазоне, обозначаемом обычно как 95% доверительный интервал (см. главу 9). Ширина этого диапазона определяет степень точности оценок чувствительности и специфичности. Следовательно, если обследованные группы пациентов малы, то оцененным по ним значениям чувствительности и специфичности не следует слишком доверять.
На рис. 3.7 показано, как возрастает точность оценки чувствительности с увеличением числа обследованных. В данном примере наблюдаемая чувствительность диагностического теста равна 75%, причем, если эта оценка основана на наблюдении всего 10 пациентов, то истинная чувствительность просто из-за случайности может колебаться от 45 почти до 100%. Если в исследование включить больше пациентов, то 95% доверительный интервал сужается, т.е. точность оценки возрастает.
Рис. 3.7. Точность оценки чувствительности Значения 95% доверительного интервала для чувствительности, равной 75%, в зависимости от размера выборки
Еще по теме Факторы, определяющие чувствительность и специфичность:
- Компромисс между чувствительностью и специфичностью
- Определение специфичности, чувствительности, положительного и отрицательного прогностического показателя (ПП)
- Верификация, оценка чувствительности и специфичности модели классификации
- Спрос и факторы, его определяющие
- Факторы, определяющие сенсибилизацию
- Вопрос 3. Экономические границы отрасли и факторы, их определяющие
- 13.Факторы, определяющие эффективность психокоррекции.
- Эластичность предложения, факторы, ее определяющие.
- Факторы, определяющие прогноз у больных с инфарктом миокарда
- Факторы, определяющие исход и значение местного малокровия
- Генетические факторы, определяющие эффективность химиотерапии
- Вопрос 3. Экономические границы здравоохранения и факторы, их определяющие
- Факторы, определяющие работу биоэнергетических систем и механизмы энергообеспечения
- Факторы, определяющие исход беременности при заболеваниях сердечно-сосудистой системы.
- Современные механизмы воздействия на факторы, определяющие качество здоровья в районах с низкой плотностью населения
- Современные голоса в психологии Язык определяет мышление или мышление определяет язык?
- Использование специфичных тестов
- Исследование субстратной специфичности анти-ОБМаутоантител на модельных пептидах