Достоверность и обобщаемость
Когда заключения относительно популяции делаются на основании наблюдений в выборке, возникает два фундаментальных вопроса (рис. 1.3). Во-первых, справедливы ли полученные выводы для всех элементов выборки? Во-вторых, отражает ли выборка интересующую нас популяцию?
Достоверность(internal validity) исследования определяется тем, в какой мере полученные результаты справедливы в отношении данной выборки.
Это внутренняя характеристика, она касается именно данной группы больных и не обязательно распространяется на другие группы. Достоверность клинического исследования определяется тем, насколько хорошо разработан план, правильно проведены сбор и анализ данных; степень достоверности определяется наличием и выраженностью систематических и случайных ошибок. Достоверность - необходимое, но не достаточное условие для того, чтобы клиническое наблюдение было полезным.Обобщаемость(external validity, or generalizability) - внешняя характеристика, она определяется тем, в какой мере результаты данного исследования применимы к другим группам больных. Для врача это соответствует ответу на вопрос: "Если результаты
данного исследования верны, то применимы ли они к моему пациенту?" Обобщаемость отражает обоснованность допущения, что пациенты в проведенном исследовании сравнимы с другими подобными.
Результаты безупречно выполненного исследования, обладающего высокой достоверностью, могут вводить в заблуждение, если их перенести на несопоставимую группу больных.
Пример. Каков риск разрыва аневризмы брюшной аорты? Врачи, наблюдающие подобных больных, должны знать это, чтобы правильно принимать решение о необходимости хирургического вмешательства. Ответ зависит от того, о каких пациентах идет речь. Среди больных с диаметром аневризмы менее 5 см, которым обычно еще не советуют проводить операцию, частота разрыва за 5 лет наблюдения в специализированном центре оказалась в 10 раз выше, чем в общей популяции (рис.
1.4) [6]. Это может быть обусловлено тем, что в специализированные клиники больные обычно направляются уже с симптомами угрожающего разрыва. Если бы врачи общей практики при прогнозировании возможного разрыва опирались на результаты исследования больных в специализированных центрах, то риск разрыва был бы значительно завышен, что, возможно, повлекло бы за собой неверное решение о необходимости хирургического вмешательства у больных с аневризмой аорты.
Рис. 1.3. Достоверность и обобщаемость
Рис. 1.4. Систематическая ошибка при отборе Диапазон значений риска разрыва аневризмы брюшной аорты (закрашенная область) за 5 лет наблюдения больных с аневризмой (диаметром менее 5 см) в общей популяции и в специализированном центре [6]
Обобщаемость клинических исследований, даже имеющих высокую достоверность, зависит от личной точки зрения, не обязательно совпадающей у разных людей.
Пример. В Исследовании здоровья врачей (Physician’s Health Study) [7] показано, что прием низких доз аспирина (по 325 мг через сутки) предупреждает развитие инфаркта миокарда у мужчин без ИБС. Среди 11 037 врачей, случайным образом отобранных и получавших аспирин, число случаев инфаркта миокарда было на 44% ниже, чем у 11 034 принимавших плацебо. Исследование проводилось тщательно, в соответствии со строгим научным планом, так что в результатах было трудно сомневаться, однако в нем участвовали только здоровые врачи-мужчины. После публикации результатов исследования клиницистам пришлось размышлять, назначать ли аспирин женщинам, лицам с множественными факторами риска и больным с диагностированной ИБС. Впоследствии анализ всех имевшихся в литературе данных показал, что аспирин эффективен и для этих групп [8].
Высокая обобщаемость редко может быть достигнута в каком-либо одном исследовании.
Даже популяция, относящаяся к целому географическому региону, представляет собой смещенную выборку из еще более крупной популяции. Например, пациенты больницы - это смещенная выборка из населения района; население района - из населения города, страны и т.д. Проведение мно-гоцентрового исследования может повысить обобщаемость, но не решит проблему окончательно.
Обычно самое большее, что может предпринять исследователь для повышения обобщаемости, это обеспечить достоверность своего исследования, подобрать популяцию, соответствующую поставленным задачам, и избегать работы с группами, значительно отличающимися от общей популяции. Дальнейшее повышение обобщаемости достигается уже за счет проведения других исследований в других условиях.
Смещенная выборка - это такая выборка, которая систематическим образом отличается от популяции, представляющей предмет исследования, или от популяции по отношению к которой должны применяться результаты исследования. Большинство клинических исследований проходит в медицинских центрах, где обычно сосредоточены больные с более тяжелой стадией заболевания; эти исследования имеют дело со смещенными выборками, в результате заболевание представляется более серьезным, чем в действительности.
Еще по теме Достоверность и обобщаемость:
- ГЛАВА 2. АНАЛИЗ ИСХОДНОЙ СИТУАЦИИ ОБУЧЕНИЯ РАБОТНИКОВ ЗДРАВООХРАНЕНИЯ ОСНОВАМ МЕДИЦИНСКОЙ ИНФОРМАТИКИ
- Достоверность и обобщаемость
- Рандомизированные контролируемые испытания
- Альтернативы рандомизированным испытаниям
- Фазы испытания лекарственных средств
- Как читать медицинскую литературу
- Оценка статей
- Основные рекомендации для определения достоверности клинических исследований
- СЛОВАРЬТЕРМИНОВ