Рандомизированные контролируемые испытания
Схематично ход клинического испытания представлен на рис. 7.1. Для исследования сначала отбираются пациенты из боль-
Рис.
7.2. Систематические ошибки в клинических испытанияхшого числа людей с изучаемым состоянием. Затем этих пациентов разделяют случайным образом на две группы, сопоставимые по основным прогностическим признакам. Одна группа, называемая экспериментальной, или группой лечения, подвергается вмешательству, которое, как ожидается, будет полезным. Другая группа, называемая контрольной, или группой сравнения, находится точно в таких же условиях, как первая, за исключением того, что составляющие ее пациенты не подвергаются изучаемому вмешательству. Затем исследователи наблюдают клиническое течение заболевания в обеих группах и любые отличия в исходах приписывают изучаемому вмешательству.
Основная причина подобного построения клинических испытаний состоит в стремлении избежать систематических ошибок при сравнении эффективности двух или большего числа вмешательств. Достоверность клинических испытаний зависит от того, насколько в сравниваемых группах удалось обеспечить одинаковое распределение всех факторов, определяющих прогноз, кроме изучаемого вмешательства.
Далее в этой главе будет описана методика проведения и интерпретации клинических испытаний на примере схемы, изображенной на рис.7.2.
Формирование выборки
Характеристики пациентов, включаемых в испытание, определяют, в какой степени полученные выводы могут быть перенесены на других больных. Среди многих причин, по которым пациенты с изучаемым заболеванием не включаются в исследование, основными являются следующие три: больные не отвечают установленным критериям включения, отказываются участвовать в нем или не соблюдают условий его проведения.
Во-первых, критерии включения формулируются для ограничения разнородности пациентов. Основные критерии, ограничивающие включение, таковы: нетипичный характер заболевания, наличие других болезней, необычно плохой прогноз (который может стать причиной выбывания пациента во время исследования) или высокая вероятность несоблюдения предписанного лечения. Естественно, в исследование не включаются также больные, у которых имеются противопоказания к одному из видов исследуемого лечения. Такое ограничение разнородности повышает достоверность исследования - сокращается возможность исходов, не связанных с самим лечением. Кроме того, это позволяет точно оценить обобщаемость, поскольку известно, по отношению к каким больным применимы результаты. Однако исключение части пациентов приводит к снижению обобщаемости результатов, так как в клинической практике могут достаточно часто встречаться больные, подобные тем, которые не были включены в исследование.
Во-вторых, пациенты могут отказаться от участия в исследовании. Некоторые не хотят лечиться предлагаемым методом либо возражают против того, что выбор лечения определяется случайным образом, а не их лечащим врачом. Пациенты, отказавшиеся участвовать в исследовании, обычно отличаются от тех, кто дает свое согласие, по социально-экономическому статусу, тяжести заболевания и другим признакам, связанным или не связанным со здоровьем.
В-третьих, исключаются пациенты, которые на ранних стадиях испытания показали неспособность строго следовать предписанной методике лечения. Это позволяет избежать напрасной траты усилий и снижения достоверности исследования вследствие выбывания пациентов или их перехода из группы в группу.
В результате указанных причин пациенты в клинических испытаниях обычно представляют собой высокоселективную выборку, смещенную относительно общей совокупности больных с изучаемым состоянием (рис. 7.3). Поэтому переносить полученные в клинических испытаниях результаты в обычную клиническую практику нужно с осторожностью.
Вмешательство
Исследуемое вмешательство характеризуется тремя свойствами: практической применимостью, сложностью и эффективностью.
Во-первых, применимо ли предлагаемое вмешательство в обычной клинической практике? Пытаясь стандартизовать лечение таким образом, чтобы оно могло быть легко описано и воспроизведено в других лечебных учреждениях, некоторые исследователи прекращают дальнейшую работу, убедившись, что их результаты не найдут применения в повседневной практике.
Во-вторых, в научных исследованиях применяют однокомпонентные высокоспецифичные виды вмешательств, которые могут быть точно описаны и воспроизведены. Что касается практикующих врачей, то им постоянно приходится делать выбор из альтернативных видов лечения, включающих многие элементы. Многокомпонентные вмешательства поддаются точной оценке лишь в той мере, в какой они воспроизводимы в других условиях.
Пример. Известно, что по различным причинам пожилые люди часто падают. Rubenstein et al. [4] изучали эффективность программы профилактики падений у пожилых. Обслуживаемые местной поликлиникой пожилые люди, у которых отмечались случаи падения, были случайным образом распределены на две группы - в одной группе применялась специальная программа профилактики (экспериментальная группа), а в другой - обычный уход (контрольная группа). Программа включала в себя подробное обследование, лабораторные тесты и оценку окружающей обстановки пациента; кроме того, пациенты получали рекомендации от врача общей практики. В течение последующих 2 лет в экспериментальной группе по сравнению с контрольной уменьшилось число падений, было на 26% меньше госпитализаций и на 52% меньше число дней, проведенных в больнице.
В-третьих, достаточно ли изучаемое вмешательство отличается от альтернативных способов лечения, чтобы можно было ожидать существенного влияния на исход? Некоторые заболевания могут быть излечены путем устранения единственной причины (например, у больных с гипертиреозом). Однако большинство заболеваний обусловлено сочетанием многих факторов, так что трудно ожидать значительного терапевтического эффекта от вмешательства, изменяющего, причем незначительно, лишь один из факторов.
Поэтому вряд ли стоит удивляться, если в исследовании вмешательства может быть сделан вывод о его неэффективности.Процент больных
Рис. 7.3. Отбор пациентов для клинических испытаний Исследование эффективности программы
по снижению риска поражения нижних конечностей у пациентов с сахарным диабетом [Litzelman
D К 1 Slemenda C W et al Ann Intern Med 1993,119 36-41 ]
Группы сравнения
О ценности изучаемого метода лечения можно судить только путем сравнения его результатов с эффектом других лечебных мероприятий. Для оценки результата исследуемого лечения следует провести сравнение между группами, получающими различные виды лечения. Вопрос заключается не в том, использовать ли метод сравнения вообще, а в том, как обеспечить правомерность сравнений.
Отсутствие вмешательства
Можно сравнивать эффект исследуемого вмешательства с отсутствием вмешательства. При этом одна группа больных получает лечение, а другая не получает его и не находится под медицинским наблюдением. Такое сравнение позволит оценить общий эффект медицинской помощи как связанный с исследуемым вмешательством, так и не связанный с ним.
Наблюдение
Можно сравнивать эффект исследуемого лечения с обычным наблюдением без какого-либо вмешательтва. Дело в том, что все пациенты, участвующие в исследовании, неизбежно ощущают к себе особое внимание. Осознавая, что они являются предметом специального интереса, люди невольно меняют свое поведение, независимо от характера получаемого ими лечения. Этот феномен называется эффектом Готорна(Hawthorne effect). Причины его не ясны. Возможно, пациенты стремятся порадовать своих докторов, или им хочется внести вклад в получение ’’хороших" результатов. Сравнение результата лечения с итогами простого наблюдения позволяет отделить вклад вмешательства от эффекта Готорна.
Лечение плацебо
Можно сравнивать исследуемое лечение с назначением плацебо.
Плацебо - это лекарственная форма, не отличимая от исследуемого препарата по внешнему виду, цвету, вкусу и запаху, но не оказывающая специфического действия (например, таблетки глюкозы или инъекции физиологического раствора). Показано, что плацебо, которое больной уверенно принимает за лекарство, уменьшает послеоперационную боль, тошноту и зуд приблизительно у 1/з пациентов. Этот феномен называется эффектом плацебо(placebo effect).
Пример. Пациенты с тяжелым хроническим зудом участвовали в испытании лекарственных препаратов, купирующих зуд [5]. В течение каждой из трех недель в случайной последовательности 48 пациентов получали либо ципрогептадина хлорид, либо тримепразина тартрат, либо плацебо. Кроме того, в график приема препаратов и плацебо был введен (также в случайном порядке) однонедельный перерыв. Результаты оценивались в отсутствие сведений о принимаемом препарате и представлялись в баллах выраженности зуда: чем выше балл, тем сильнее зуд. Полученные средние значения были следующими: ципрогептадина хлорид - 28, тримепразина тартрат - 35, плацебо - 30, отсутствие лечения - 50. Таким образом, оба активных препарата, равно как и плацебо, были одинаково эффективны и дали гораздо лучшие результаты, чем отсутствие лечения.
Эффект плацебо имеет разный смысл для исследователей и для клиницистов. Исследователи больше, чем врачи-практики заинтересованы в установлении специфических эффектов, имеющих отношение к современным теориям о причинах заболевания, и рассматривают эффект плацебо как базальный уровень для измерения специфических лечебных эффектов. Врачи должны воспринимать эффект плацебо в качестве лечебного и стараться максимально использовать его, так же как и любой другой способ помощи пациентам.
Многие клинические вмешательства имеют как специфические, так и неспецифические эффекты (рис.7.4). Для врачей и пациентов важен полный эффект вмешательства, определяемый как отличие в состоянии пациента в результате лечения по сравнению с тем, что с ним произойдет при естественном течении заболевания, т.е.
без лечения. Однако важно знать, какая часть лечебного эффекта имеет специфический характер, а какая - неспецифический, чтобы избежать применения опасного, неприятного или дорогостоящего вмешательства, лишь малая доля эффекта которого обусловлена специфическим действием.Обычное лечение
Можно сравнивать исследуемое лечение с обычным лечением. Это целесообразно и приемлемо с точки зрения этики только в том случае, если известно, что обычное лечение эффективно.
Таким образом, суммарный лечебный эффект исследуемого препарата складывается из четырех компонентов, что продемонстрировано на рис. 7.5.
Назначение лечения
Для исследования специфического лечебного действия вмешательства целесообразнее всего распределять пациентов по груп-
Рис. 7.4. Соотношение между специфическим и неспецифическим эффектами лекарственных препаратов [Fletcher R H Fam Med REV 1983,1 40-48]
Рис. 7.5. Вклад различных причин в суммарный лечебный эффект
пам случайным образом, т.е. путем рандомизации(randomization). При этом назначение исследуемого или контрольного лечения производится при помощи процедуры, аналогичной подбрасыванию монеты, обеспечивающей равные (или по крайней мере известные) шансы попасть в ту или другую группу.
Рандомизация - оптимальный метод выбора лечения, так как позволяет избежать систематической ошибки при разделении пациентов на группы. Это означает, что пациенты одной группы будут в среднем обладать теми же характеристиками, что и пациенты другой. Достичь такого распределения в изучаемых группах всех факторов, связанных с прогнозом, независимо от того, известны они до исследования или нет, можно только посредством рандомизации.
В конечном счете при участии в испытании большого числа пациентов рандомизация обычно ’’работает” так, как описано выше. Однако случайное распределение не гарантирует, что все группы действительно будут одинаковыми. Хотя процесс случайного выбора лечения свободен от систематической ошибки, результат все же может оказаться смещенным. Различие между группами может возникнуть просто случайно, особенно если число включенных в исследование пациентов невелико. Для того чтобы оценить, не случилось ли такое ’’невезение", авторы рандомизированных контролируемых испытаний часто представляют таблицу, в которой сравнивается частота различных характеристик (особенно тех, которые заведомо связаны с исходом) в экспериментальной и контрольной группах. Всегда необходимо убедиться в том, что важные характеристики пациентов распределились практически одинаково между группами сравнения. Если же имеются некоторые различия, то их можно оценить и попытаться нивелировать при анализе (см. гла- вуб).
По мнению некоторых исследователей, для снижения вероятности "невезения”, следует до рандомизации убедиться в том, что по крайней мере некоторые характеристики, о которых известно, что они сильно влияют на исход, встречаются в экспериментальной и контрольной группах с одинаковой частотой. Для этого предлагается сначала распределить пациентов по подгруппам с одинаковым прогнозом и только затем рандомизировать их отдельно в каждой подгруппе - такой процесс называется стратифицированной рандомизацией(stratified randomization). При этом подходе группы обязательно должны получиться сравнимыми по характеристикам, использованным при формировании подгрупп. Другие исследователи возражают, утверждая, что различия, случайно возникающие в результате "невезения", как правило, незначительны, и с ними можно справиться математическими методами уже после того, как данные собраны.
Различия, возникающие после рандомизации
Не все пациенты участвуют в клиническом испытании в соответствии с его первоначальным планом. Например, может выяс
ниться, что у некоторых больных нет изучаемого заболевания, как считалось при включении их в испытание; другие прекращают контакт с исследователем, не принимают назначенных препаратов, выбывают из-за побочных эффектов или других заболеваний, по тем или иным причинам получают лечение, предписанное другой группе, или не применяемое в данном исследовании. В итоге сопоставимость групп, достигнутая в результате рандомизации, нарушается к тому времени, когда необходимо анализировать исходы.
Отсутствие изучаемого заболевания
В клиническом испытании, да и на практике иногда приходится назначать лечение прежде, чем удастся полностью удостовериться в том, что у пациента именно то заболевание, по поводу которого показано данное вмешательство.
Пример, Для того чтобы выяснить, повышают ли моноклональные антитела к эндотоксину выживаемость при сепсисе, 543 пациента с сепсисом и подозреваемой грамотрицательной инфекцией были случайным образом разделены на две группы - больные одной группы получали антиэндотоксин, больные другой группы - плацебо [6]. В подгруппе пациентов, у которых действительно была грамот- рицательная бактериемия, летальность снизилась с 49 до 30%, что существенно больше случайной разницы. Однако лишь у 200 пациентов (37%) имелась грамотринательная бактериемия, подтвержденная результатами посева крови. Следовательно, причины, объясняющие эффективность препарата у остальных 63% больных, отсутствовали. Для всех пациентов с сепсисом (как имевших, так и не имевших бактериемию), летальность составляла 43% в группе получавших плацебо и 39% в группе получавших антиэндотоксин. Это различие незначительно и может быть обусловлено случайностью. Таким образом, исследование показало, что препарат эффективен в отношении грамотрицательных бактерий, а не сепсиса. Важны оба результата: первый - для ученых, заинтересованных в выяснении биологического действия антиэндотоксина на бактерии, второй - для клиницистов, которые должны знать клинический эффект применения препарата у больных сепсисом, учитывая, что решение приходится принимать прежде, чем станет известно, действительно ли у пациента имеется бактериемия.
Если предположение о наличии у пациента изучаемого заболевания не подтверждается, то за такую ошибку приходится расплачиваться. Обследование дополнительного числа пациентов, которые не получат пользы от специфического лечения, уменьшает эффективность испытания - чтобы выявить эффект, нужно включить в исследование больше пациентов. Иначе говоря, из-за
того, что пациенты, у которых может проявиться специфический эффект, смешаны с теми, у которых его быть не может, эффективность лечения оказывается меньше, чем в исследовании, в которое включены только пациенты с наличием заболевания. Это уменьшает шансы обнаружения эффекта при заданном числе пациентов в испытании (см. главу 9). Однако важное достоинство исследований подобного типа состоит в том, что они предоставляют информацию о последствиях принятия решения так, как это видится с точки зрения клинициста (см. далее в этой главе раздел ’’Испытания с анализом данных в зависимости от назначенного или полученного лечения”).
Соблюдение предписаний врача
Говоря о соблюдении пациентом предписаний врача, мы имеем в виду то, насколько точно больной, участвующий в клиническом испытании, выполняет требования, предъявляемые к нему врачом-исследователем. Пациент может сознательно идти на нарушение предписаний, однако чаще такое несоблюдение требований связано с тем, что больной не понял, какие препараты, в какой форме и дозе следует принимать, или препарат закончился, или у него нет денег на приобретение лекарств. Нарушение предписаний врача может привести к тому, что лечение, показавшее свою эффективность в специальных условиях, окажется неэффективным на практике.
Соблюдение предписаний особенно важно при амбулаторном наблюдении. В клинике многие факторы ограничивают поведение больного и делают его более дисциплинированным. В стационаре у пациентов создается впечатление, что их состояние намного тяжелее, чем на самом деле, и они этим обеспокоены. Они оказались в непривычной обстановке, зависят от квалификации и внимания персонала во всем, даже в сохранении самой жизни. Кроме того, медицинский персонал больниц действует по схеме, гарантирующей получение пациентом назначенного лечения. Таким образом, клинический опыт и данные медицинской литературы, отражающие условия стационара, могут недооценивать фактор соблюдения больным предписаний врача вне больницы, где лечится большинство больных и где гораздо труднее добиться выполнения назначений.
В клиническом испытании сравнение эффекта лечения у пациентов, соблюдающих и не соблюдающих назначения, может привести к ошибочным выводам.
Пример. В крупном исследовании [7] влияния нескольких гипо- липидемических препаратов на развитие стенокардии 1103 мужчи
нам был назначен клофибрат и 2789 мужчинам - плацебо. Пятилетняя летальность составила 20,0% в группе принимавших клофибрат и 20,9% в группе принимавших плацебо, что указывает на неэффективность препарата.
В то же время было обнаружено, что не все пациенты принимали лекарство. Был ли клофибрат эффективен у тех, кто действительно принимал препарат? Ответ оказался утвердительным. В экспериментальной группе пятилетняя летальность среди пациентов, действительно принимавших клофибрат, составила 15,0% по сравнению с 26,4% у пациентов, не соблюдавших схему лечения (p
Еще по теме Рандомизированные контролируемые испытания:
- Альтернативы рандомизированным испытаниям
- Использование дискриминантного анализа для дифференциальной диагностики в рандомизированной группе больных.
- Применение результатов испытаний к конкретному больному
- Контролируемость
- Фазы испытания лекарственных средств
- Методы и средства диагностирования и испытания эндопротезов крупных суставов
- Контролируемая стимуляция
- Изменения некоторых показателей крови у рандомизированных групп больных раком желудка и толстой кишки.
- 4.2.2. Контроль за воздействием на природную среду при проведении испытаний и отработке новой техники.
- Получение бета-ЦД методами контролируемой конверсии
- Контролируемая овариальная стимуляция у доноров ооцитов и пациенток с онкологическими заболеваниями