Как бороться с систематической ошибкой, возникающей при отборе

В идеале, для определения связи фактора с прогнозом лучше всего было бы сравнивать две абсолютно идентичные когорты, различающиеся только тем, что в одной из них изучаемый фактор имеется, а в другой - нет, т.е.

все остальное, за исключением этого фактора, у этих когорт одинаково. Но в реальных когортных исследованиях "все остальное" обычно одинаковым не бывает.

Как разрешить эту проблему? Существует несколько при-

емов, которые позволяют нивелировать различия между группами сравнения либо на стадии планирования исследования, либо при анализе его результатов (табл. 6.2). Читатель должен скептически относиться к любому исследованию, в котором не применялся один или несколько таких приемов. Основной вопрос, на который должно ответить исследование, заключается в том, связаны ли различия в прогнозе для разных групп только с исследуемым фактором или они зависят от каких-либо других факторов. Таблица 6.2 Методы устранения систематических ошибок, возникающих при отборе
		Этап исследования
Метод	Описание	планирование анализ
Рандомизация	Распределить пациентов по группам таким образом, чтобы каждый пациент имел равные шансы попасть в ту или иную группу	+
Введение ограничений	Ограничить диапазон характеристик пациентов, включаемых в исследование	+
Подбор соответствующих пар	Каждому пациенту в одной группе подобрать одного или более пациентов с такими же характеристиками (кроме изучаемой) для группы сравнения	+
Стратификация	Сравнить влияние изучаемого фактора на частоту исходов внутри подгрупп, имеющих одинаковый исходный риск	+
Стандартизация
простая	Математически скорректировать исходное значение какой-либо одной характеристики таким образом чтобы уравнять подгруппы по исходному риску	+
множественная	Скорректировать различия по многим влияющим на исход факторам, применяя методы математического моделирования	+
Анализ
"наилучший вариант- наихудший вариант"	Описать результаты, которые могут получиться, если исходить из предположения о максимальной выраженности систематической ошибки при отборе	+

Рандомизация

Рандомизация - метод случайного отнесения больного к той или иной исследуемой группе.

Единственный способ уравнять все посторонние факторы (’’все остальное”) состоит в том, чтобы распределить пациентов по группам случайным образом так, чтобы каждый пациент имел равный шанс попасть в группу воздействия и в группу без него. Рандомизация уравнивает вероятность воздействия на пациента не только тех факторов, которые, как мы предполагаем, могут влиять на прогноз, но и тех, о существовании которых мы даже не знаем. Таким образом, рандомизация защищает нас от неверных заключений относительно прогностических факторов. Однако рандомизация обычно неприменима в исследованиях прогноза. Конкретные ситуации, в которых можно применять рандомизацию (обычно - при исследовании того, как лечение влияет на прогноз), будут обсуждаться в главе 7.

Введение ограничений

Для того чтобы уравнять вероятность воздействия важных посторонних факторов, можно ограничить контингент пациентов, включенных в исследование, только теми, кто обладает узким диапазоном характеристик. Например, влияние возраста на прогноз после острого инфаркта миокарда может быть исследовано на мужчинах с неосложненным инфарктом передней локализации. Однако необходимо иметь в виду, что хотя ограниченное включение способствует однородности групп, это достигается ценой отказа от обобщаемости результатов. В процессе исключения потенциальных участников могут быть сформированы нетипичные когорты, и результаты таких исследований нельзя будет переносить на большинство пациентов с данным состоянием.

Подбор соответствующих пар

Испытуемые могут подбираться таким образом, чтобы для каждого пациента из одной группы существовал один или несколько пациентов в группе сравнения с такими же характеристиками, кроме изучаемого фактора. Часто пациентов подбирают по возрасту и полу, поскольку эти факторы сильно связаны с прогнозом для многих заболеваний. Однако такой подбор можно рекомендовать и для многих других факторов, таких как стадия или степень тяжести заболевания, скорость прогрессирования и предшествующее лечение.

Пример применения метода подбора пар в когорте пациентов с серповидно-клеточной анемией был рассмотрен при обсуждении обсервационных исследований в главе 5.

Хотя подбор пар используется часто и может быть весьма полезен, он позволяет нивелировать систематическую ошибку, обусловленную только теми факторами, которые учитываются при подборе пар. Кроме того, как правило, невозможно подобрать пары, схожие более чем по нескольким признакам, поскольку на практике трудно найти пациентов, удовлетворяющих всем критериям отбора. К тому же, если характеристики, использованные при подборе пар, относительно грубы, между отобранными группами остаются различия. Например, если исследование риска рождения ребенка с синдромом Дауна провести путем подбора пар по возрасту матерей в 10-летнем диапазоне, то частота рождения больного ребенка в зависимости от возраста матери будет различаться почти в 10 раз между группами, большинство в одной из которых составляют 30-летние, а в другой - 39-летние женщины. И еще - поскольку вводимое ограничение или подбор пар производится по некоторому признаку, его влияние на исходы оценить не удастся.

Стратификация (stratification)

После того как данные собраны, производится их анализ и результаты представляются по подгруппам пациентов со сходными характеристиками {стратификация).

Пример. Предположим, что нужно сравнить послеоперационную летальность при операции аортокоронарного шунтирования в больницах А и Б. Всего в больнице А отмечено 48 смертей на 1200 операций (4%), а в больнице Б - 64 смерти на 2400 операций (2,6%). Согласно этим огрубленным показателям, больница Б лучше, чем А. Так ли это в действительности? Не исключено, что пациенты двух больниц исходно несопоставимы по прогнозу. На основании возраста, функции миокарда, степени стеноза и других характеристик можно подразделить пациентов на подгруппы с разным доопераци- онным риском (табл. 6.3), а затем сравнить послеоперационную летальность в пределах каждой подгруппы.

После того как пациенты были разделены по дооперационному риску, послеоперационная летальность в каждой подгруппе риска оказалась абсолютно одинаковой для обеих больниц: 6,0, 4,0 и 0,67% для пациентов с высоким, средним и низким риском соответственно. Очевидный источник ошибочного первоначального вывода кроется в том, что для оценки используется только грубый показатель летальности, тогда как на самом деле характеристики пациентов в двух больницах существенным образом различались: высокий риск имели 42% пациентов в больнице А против 17% пациентов в больнице Б.

Стратификация - один из наиболее часто применяемых и действенных приемов борьбы с систематической ошибкой.

Таблица 6.3 Пример стратификации: гипотетические показатели летальности после аортокоронарного шунтирования в двух больницах после распределения больных на подгруппы в зависимости от дооперационного риска
		Больница А			Больница Б
Дооперационный риск	число больных	число летальных исходов	летальность %	число больных	число летальных исходов	летальность.%
Высокий	500	30	6	400	24	6
Средний	400	16	4	800	32	4
Низкий	300	2	0 67	1200	8	0 67
Всего	1200	48	4	2400	64	26

Стандартизация

От систематической ошибки можно избавиться при сравнении двух показателей, если скорректировать их таким образом, чтобы веса факторов, влияющих на исход, были равны. Этот процесс называется стандартизацией, или коррекцией(standardization, or adjustment).

Суть его заключается в том, что мы рассчитываем частоту исходов для каждой подгруппы, а затем формируем две гипотетические сравниваемые группы, в которых каждая соответствующая подгруппа со своим специфическим показателем частоты исхода представлена равным числом пациентов. В предыдущем примере показатель летальности для пациентов с высоким риском, равный 6%, получил удельный вес 500/1200 в больнице А и значительно меньший удельный вес, 400/2400, в больнице Б и т.д.; в итоге грубый показатель летальности для больницы A=(500∕1200 ? 0,06)+(400∕1200 ? 0,04)+(300∕1200 ? 0,0067)=0,04, а для больницы B=(400∕2400 ? 0,06)+(800∕2400 ? 0,04)+( 1200/2400 ? 0,0067)=0,026.

Если ввести для подгрупп равные веса, например, ¹∕3 (цифры могут основываться на данных для той или иной больницы или любой другой референсной популяции), тогда стандартизованный показатель летальности в больнице А составит (¹∕3 ? O,O6)+(¹∕3? 0,04)+(¹∕3? 0,0067)=0,036 и то же самое - в больнице Б. Благодаря заданному равному весу всех подгрупп в обеих группах полностью устранен кажущийся избыточный послеоперационный риск в больнице А.

Различия между грубым показателем послеоперационной летальности в двух больницах возникают в результате систематической ошибки, обусловленной различиями дооперационного риска у пациентов. Но нас интересуют только различия, связанные с са

мой больницей и квалификацией хирургов, а не с пациентами как таковыми. Различия в грубых показателях летальности вызваны различиями пациентов, в то время как стандартизованные показатели летальности уравнивают веса дооперационного риска у пациентов обеих больниц. Стандартизация чаще применяется в исследованиях риска (в которых показатели частоты обычно стандартизуются по возрасту, полу и/или расе), чем в прогностических исследованиях. В отличие от метода стратификации (часто используемой в прогностических исследованиях), стандартизация нивелирует эффект посторонних факторов.

При стратификации эффект фактора может быть выявлен, даже если именно он используется в качестве признака, по которому производится разделение. Таким образом, благодаря стандартизации мы показали, что в больницах А и Б пациенты имеют одинаковый прогноз. При помощи стратификации был получен тот же результат.

Множественная стандартизация

В большинстве клинических ситуаций одновременно действуют многие факторы. Между ними существуют сложные взаимные влияния. Эти переменные могут быть связаны как друг с другом, так и с изучаемым исходом, один фактор может изменять эффект другого, а общий эффект двух или нескольких факторов иногда больше, чем простая сумма их индивидуальных эффектов.

Многофакторный анализ(multivariable analysis) - это метод одновременного рассмотрения воздействий многих переменных (см. главу 9). Он используется для того чтобы одновременно корректировать эффекты многих переменных для выявления независимого действия одного фактора. Кроме того, метод позволяет выделить из большого числа переменных малое их подмножество, которое вносит независимый и существенный вклад в исход, и упорядочить переменные по силе их влияния на исход. Анализ пропорционального риска Кокса(Cox’s proportional hazard analysis)- это вид многофакторного анализа, используемый в случае, когда исходом служит время наступления события (как в анализе выживаемости).

Многофакторный анализ - единственный реальный способ обработки многих данных (переменных), когда на этапе анализа исследования приходится иметь дело сразу со многими переменными. (Рандомизация также контролирует множество переменных, но на этапах планирования и проведения исследования.) Более простые методы, такие как стратификация или подбор соответствующих пар, позволяют одновременно рассматривать только несколько переменных, причем в ущерб статистической мощности.

Анализ чувствительности

В отсутствие данных о важных прогностических факторах их потенциальный эффект можно оценить, предполагая различную степень диспропорции в распределении этих факторов между сравниваемыми группами и оценивая, как это повлияет на результат. Такой процесс носит общее название "анализ чувствительности " (sensitivity analysis). Анализ ’’наилучший вариант - наихудший вариант”, о котором уже шла речь в этой главе, представляет собой специальный вид анализа чувствительности, когда результаты сравниваются, исходя из предположения наименьшей и наибольшей диспропорции в распределении переменной, используемой для прогнозирования¹.

Предположение худшего - это более строгий тест для проверки влияния фактора на результаты исследования. Менее жесткий подход состоит в предположении того, что фактор распределен между группами маловероятным образом.

Пример. Исследование методов лечения при легких формах сахарного диабета показало, что у пациентов, которым назначали препарат сульфонилмочевины толбутамид, был более высокий риск смерти от сердечно-сосудистых заболеваний, чем у тех, которым назначали инсулин или только диету. Результат подвергся критике, поскольку авторы не собирали и не учитывали при анализе данные о курении - известном факторе, связанном с сердечно-сосудистой смертностью. Было высказано предположение, что если курящие распределились по группам неодинаково, а именно так, что среди получавших толбутамид их оказалось больше, то различия следовало бы связать с курением, а не с назначением толбутамида. Однако Cornfield [10] отметил, что даже если в группе леченных толбутамидом число курящих было бы на 20% больше, чем в контрольной группе (маловероятная ситуация: 1 шанс из 50 000), то повышенный риск смерти в группе больных, леченных толбутамидом, все равно бы сохранился. Следовательно, наблюдаемые различия между группами нельзя объяснить за счет систематической ошибки, обусловленной диспропорцией в распределении курящих.

Общая стратегия

За исключением рандомизации, все методы устранения влияния различий между группами имеют следующий недостаток: они эффективны только в отношении тех факторов, которые выделены для рассмотрения, но не затрагивают неизвестные на момент исследования или известные, но не принятые во внимание прогностические факторы.

Анализ чувствительности может также использоваться для оценки потенциального в'шяния неточности данных при анализе принятия решений (см главу 4)

Обычно исследователи не ограничиваются каким-либо одним методом устранения систематической ошибки, а используют сразу несколько. Так, проводя исследование с целью выяснения, снижается ли при желудочковых экстрасистолах выживаемость после перенесенного острого инфаркта миокарда, можно поступить следующим образом: а) не включать в исследование пациентов слишком молодого или старческого возраста, а также необычные случаи инфаркта (например, вследствие септической аневризмы); б) произвести подбор пар по возрасту - фактору, сильно связанному с прогнозом, но постороннему по отношению к изучаемому фактору; в) анализировать результаты раздельно по подгруппам с разной степенью тяжести заболевания (например, наличие или отсутствие сердечной недостаточности либо других заболеваний, таких как хронические обструктивные заболевания легких); г) с помощью многофакторного анализа скорректировать грубый результат по эффектам всех вместе взятых переменных, которые могут быть связаны с прогнозом, кроме аритмии.

<< | >>

↑

Источник: Клиническая эпидемиология. Основы доказательной медицины. Р. Флетчер, С. Флетчер, Э. Вагнер. Пер. с англ. - M.,1998. - 352 с., илл.. 1998

Еще по теме Как бороться с систематической ошибкой, возникающей при отборе:

- Основы эпидемиологии -

- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -