Точечные оценки и доверительные интервалы
Величина эффекта (например, лечебный эффект в клиническом испытании или относительный риск в когортном исследовании), наблюдаемая в конкретном исследовании, называется то
чечной оценкой эффекта.
Эта оценка лучше всего отражает истинную эффективность вмешательства и, кроме того, является обобщающим статистическим показателем, на который обычно делается основной акцент в научных публикациях.Однако истинная величина лечебного эффекта обязательно отличается от наблюдаемой в исследовании. В каждом конкретном исследовании результат будет либо выше, либо ниже истинной величины из-за случайной вариации. Следовательно, нужна обобщающая оценка степени вариации, которую можно ожидать вследствие случайности.
Статистическая точность оценки наблюдаемой величины эффекта выражается доверительным интервалом(confidence interval), обычно 95%, охватывающим область по обе стороны от точечной оценки. Доверительный интервал величины эффекта интерпретируется следующим образом: если в исследовании отсутствовала систематическая ошибка, то этот интервал с вероятностью 95% включает в себя истинную величину лечебного эффекта. Чем уже доверительный интервал, тем ближе точечная оценка эффекта к истинной величине. Истинная величина с наибольшей вероятностью находится вблизи точечной оценки, менее вероятно - у границ доверительного интервала и с еще меньшей вероятностью (5 из 100) Moaςeτ выходить за пределы интервала. Статистическая точность возрастает с увеличением статистической мощности исследования.
Доверительные интервалы дают информацию, аналогичную статистической значимости. Если точка, соответствующая полному отсутствию лечебного эффекта (например, относительный риск, равный 1, или различие в эффективности лечения, равное 0), лежит за пределами 95% доверительного интервала наблюдаемого эффекта, то результаты скорее всего статистически значимы при уровне значимости 0,05.
Если эта точка находится внутри доверительного интервала, то результаты статистически незначимы.Доверительные интервалы имеют ряд преимуществ. Они позволяют сделать акцент на величине эффекта. Доверительные интервалы позволяют читателям увидеть диапазон правдоподобных оценок и с учетом этого решить, согласуется ли величина эффекта, которую они считают клинически значимой, с результатами исследования [7]. Кроме того, доверительные интервалы дают представление о статистической мощности. Если размах доверительного интервала относительно велик и величина, соответствующая отсутствию эффекта, лежит на периферии интервала, то для установления статистически значимого различия следует увеличить мощность исследования.
Пример. На рис. 9.4 показаны точечные оценки и их доверительные интервалы для относительного риска развития трех заболеваний: рака эндометрия, рака молочной железы и перелома шейки бедра при приеме эстрогенов. (Обратите внимание, что риск представлен на логарифмической шкале, а это создает впечатление более узких, чем на самом деле, доверительных интервалов для более высоких рисков.) Наблюдаемый относительный риск развития рака эндометрия (после 8 и более лет лечения эстрогенами) составляет 8,22, но это не точно соответствует истинной величине, которая вполне может быть более высокой - 10,61 или более низкой - 6,25. В любом случае маловероятно, что она окажется равной 1,0 (отсутствие риска). Что касается рака молочной железы, то, согласно результатам исследования, прием эстрогенов вряд ли может быть фактором риска развития этого заболевания; точечная оценка относительного риска близка к 1,0. Данные также указывают на то, что либо вредное воздействие эстрогенов незначительно, либо их профилактическая эффективность мала. И наконец, прием эстрогенов
Рис. 9.4. Точечные оценки (О) и доверительные интервалы (I) риск и польза применения препаратов эстрогенов женщинами в постменопаузе [Grady D , Rubin S M , Petitti D В , Fox G S , Black D , Ettmger В , Ernster VL , Cummmgs S R Hormonal therapy to prevent disease and prolong life in postmenopausal women AnnInternMed 1992, 117 1016- 1037, Colditz G A , Stampfer M J 1 Willett WC , Hennekens C H 1 Rosner B 1 Speizer FE Prospective study of estrogen replacement therapy and risk of breast cancer in postmenopausal women JAMA 1990, 264 2648 - 2653, and Paganini-Hill, Ross R K 1 GerkmsVR , Henderson B E , Arthur M , Mack N M Menopausal estrogen therapy and hip fractures Ann InternMed 1981,95 28-31]
вполне вероятно может предупреждать переломы шейки бедра.
Верхняя граница доверительного интервала находится ниже 1,0, т.е. профилактический эффект статистически значим при р=0,05.Точечные оценки и доверительные интервалы используются для характеристики статистической точности любого показателя частоты (заболеваемости и распространенности), сравнения показателей частоты (относительных и добавочных рисков) и других обобщающих статистических показателей. Например, отдельные исследования показали, что 34% взрослых американцев пользовались нетрадиционными методами лечения (95% доверительный интервал от 31 до 37% [8]), что при интенсивной терапии больных инсулинзависимым сахарным диабетом риск развития ретинопатии снижается на 76% (95% доверительный интервал от 62 до 85%) по сравнению с обычным лечением [9], что чувствительность клинического обследования для выявления спленомегалии составляет 27% (95% доверительный интервал от 19 до 36%) [10].
Определение доверительных интервалов стало обычным способом представления главных результатов клинических исследований, поскольку такой подход обладает многими преимуществами перед методом проверки гипотез (оценкой р). Однако оценка р все еще применяется - в силу традиции и из-за удобства использования в исследованиях, где представлено много данных и для всех трудно привести доверительные интервалы.
Еще по теме Точечные оценки и доверительные интервалы:
- Способы установления психологического контакта и доверительных отношений
- Глава 3. Экспертные оценки как один из перспективных методов оценки качества медицинской помощи
- Приложение 2 Бланк оценки выраженности профессиональных деформаций личности воспитателя ДОУ с помощью экспертной оценки
- Выбор математического аппарата для оценки эффективности полученных результатов и оценка качества работы математических моделей прогнозирования инфаркта миокарда в реабилитационном периоде
- Исследование уровня тревожности матерей по Спилбергеру в модификации Ю.Л. Ханина и оценки матерями своих детей (экспертная оценка) по Дембо-Рубинштейн в модификации А.М. Прихожан, интерпретация результатов.
- Приложение 9 Сводная карта оценки состояния охраны труда СТО 14.09.-12 «Мониторинг и оценка состояния охраны труда на рабочем месте»
- Оценка функции тазобедренного сустава до операции.
- 5.3.1 Экономическая оценка
- Оценка технологий в здравоохранении
- Оценка интенсивности хронической боли онкологической
- Психологическая оценка
- Параметры оценки
- 2.8. Оценка критериев качества
- 2.2.4. Финансирование деятельности по оценке медицинских технологий
- Методологические особенности экономической оценки
- Оценка резистентности