Проверка гипотез
В обычной ситуации, когда главные выводы исследования выражены в дихотомической форме (например, лечение рассматривается либо как успешное, либо нет), результаты статистической проверки тоже имеют дихотомический характер (результат либо статистически значим - т.е.
неслучаен, либо статистически незначим). Существуют четыре варианта соотношений между выводами исследования и действительностью (рис. 9.1).Из четырех вариантов заключений статистического теста возможны два правильных: а) эффекты разных методов лечения дей-
Рис.9.1. Соотношение между заключением статистического теста и истинным различием двух групп больных, леченных разными методами ("Отсутствует" - это фактически упрощение, которое означает, что истинное различие не превышает определенную величину)
ствительно различны и именно таков вывод исследования; б) методы лечения не различаются по своему эффекту, что и соответствует выводу исследования.
Два других варианта ошибочны. Это бывает в случае, если изучаемые методы лечения в действительности равноэффективны, но сделан вывод, что один из методов лечения лучше. Такого рода ошибка, приводящая к ложноположительному заключению об эффективности изучаемого метода лечения, называется альфа- ошибкой(α-error), или ошибкой Iрода(Type I error). Альфа-ошибка - это вероятность того, что одно лечение будет считаться лучше другого, когда в действительности это различие отсутствует. C другой стороны, лечение может быть эффективным, хотя исследование привело к выводу об отсутствии эффекта. Такое ложноотрицательное заключение называется бета-ошибкой(β-error), или ошибкой IIpoda (Type II error). Бета-ошибка - это вероятность того, что оба лечения будут считаться равноэффективными, когда в действительности одно лечение лучше, чем другое.
Вывод об ’’отсутствии различия’’ в упрощенном виде указывает на то, что истинное различие не превышает определенную величину, поскольку невозможно точно установить, что между двумя методами лечения вовсе нет различий.На рис. 9.1 представлена четырехпольная таблица, аналогичная той, в которой результаты диагностических тестов сравниваются с истинным диагнозом (см. главу 3). Здесь ’’тест” - это заключение клинического испытания, основанное на статистической оценке результатов исследования, проведенного на выборке.
Истинные различия между двумя методами лечения устанавливаются путем наблюдения всех пациентов с изучаемой болезнью или большого числа выборок, состоящих из таких больных, если бы это можно было сделать на практике. Альфа-ошибка аналогична ложноположительным, а бета-ошибка - ложноотрицательным результатам теста. В отсутствие систематической ошибки неопределенность статистического заключения обусловлена случайной вариацией.
Случайная вариация присуща любым наблюдениям, поэтому ставить вопрос о том, случайны или нет результаты исследования, было бы чрезмерным упрощением. Скорее нужно искать ответ на вопрос, какова вероятность того, что результаты, полученные при конкретных условиях исследования, объясняются случайной вариацией. Вероятность ошибки, обусловленной случайной вариацией, оценивается методами статистики. Эти методы позволяют рассчитать вероятность того, что конкретные результаты получены исключительно за счет случайности.
Статистика - это специальная область математики со своей, незнакомой многим врачам, терминологией: "нулевая гипотеза", "дисперсия", "регрессия", "мощность", "моделирование". Для неспециалистов в этой области статистическая оценка - лишь средство подведения итога исследования, оценки влияния случайной вариации.
В следующих двух разделах обсуждаются альфа- и бета- ошибки соответственно. Мы постараемся продемонстрировать, как метод проверки гипотез используется для оценки вероятности этих ошибок в медицине.
Однако мы не будем пытаться оперировать строгими количественными категориями - для этого читателю следует ознакомиться с существующими пособиями по биостатистике (см. "Рекомендуемая литература" в конце этой главы).Вывод о том, что лечение эффективно
В современной медицинской литературе статистические показатели в основном рассчитываются для определения вероятности альфа-ошибки, выражаемой в виде всем знакомой величины р. Это количественная оценка того, с какой вероятностью выявленные в конкретном исследовании различия между лечебными вмешательствами обусловлены случайностью, исходя из предположения, что в действительности различий между сравниваемыми группами нет. Смысл величины р можно проиллюстрировать следующим образом. Допустим, что различие между двумя способами лечения в действительности отсутствует, но в клиническом испытании выявлено, что одно лечение более эффективно, чем дру
гое. Если провести множество таких исследований, то какая доля испытаний покажет такую же или большую эффективность одного лечения по сравнению с другим?
Такую величину р мы будем называть pα, чтобы отличать ее от оценки другого рода случайной ошибки, обозначенной нами κaκpβ. Встречающийся в научной литературе показатель р соответствует, как правило, тому, что мы называем р«.
Ошибка, оцениваемая при помощи р«, существует всегда, когда делается заключение о более высокой эффективности одного метода лечения по сравнению с другим. Вывод о том, что между способами вмешательства нет различий, поскольку р« превышает некоторый уровень - некорректен; в этой ситуации следует применять показатель pβ(вероятность бета-ошибки).
Дихотомическая и точная оценка величины р
Стало привычным придавать особое значение тем случаям, когдар
Еще по теме Проверка гипотез:
- 3. Понятие об эмпирической проверки научных гипотез.
- Источники и виды Y гипотез
- 3. Гипотеза
- 5. Требования к формулировкам причинно-следственных гипотез.
- Выдвижение гипотез
- ПОРУЧЕНИЕ о проверке лицензиата
- УВЕДОМЛЕНИЕ о предстоящей проверке лицензиата
- 33.Психология проверки показаний на месте.
- 10. Уровни гипотез, проверяемых в психологическом эксперименте.
- Проверка согласованности и классификация экспертов
- Основные гипотезы патогенеза БА
- Кальциевая гипотеза болезни Альцгеймера
- 2.4 Построение диагностической гипотезы
- Проверка качества
- Проверка на канцерогенность.
- 39. Специфика гипотез проявляемых в факторном эксперименте.