9.5. УМЕНЬШЕНИЕ СЛУЧАЙНЫХ ФЛЮКТУАЦИЙ В РАСПРЕДЕЛЕНИЯХ
9.5.1. Этап 7. Устранение нулевых частот. Для устранения нулевых частот можно вычислять частоту по следующей формуле Г2001:
Основные свойства каждого из распределений при этом сохраняются.
Однако возникают искажения отношений частот по краям шкалы признака, если подряд в нескольких диапазонах в одном из распределений встречаются «нулевые» частоты. В этом случае при вычислении отношений вероятностей по формуле (9.12) эти отношения будут приближаться к 1 по мере приближения к краю шкалы признака, что обычно противоречит действительному положению вещей. Чтобы избежать таких искажений, целесообразно использовать следующие правила, выраженные словесно, но достаточно формализованные.Если в диапазоне, где одна из вероятностей (частот) равна нулю, отношение вероятностей Р (хц/АіУР (хц/А2) равно нулю или бесконечности, а его логарифм, именуемый ДБ, равен ±оо, то рекомендуется следующее. Когда хотя бы в одном из соседних диапазонов ДБ достаточно отличается от ±оо, в рассматриваемом диапазоне ДБ заменяют величинами с абсолютным значением от 2 до 4 (знак остается неизменным); когда в обоих соседних диапазонах ДБ равен или близок к ±оо, в рассматриваемом диапазоне ДБ заменяют величинами с абсолютным значением от 3 до 9.
Выбор большего или меньшего абсолютного значения из названных зависит от следующих обстоятельств: чем больше число наблюдений второй выборки в диапазоне, где первая выборка имеет нулевую частоту, и чем ближе отношения вероятностей в соседних диапазонах к ± оо, тем больше по абсолютной величине должен быть выбираемый ДБ. На краю распределений имеет также значение величина ДБ в диапазоне, расположенном центральнеє: необходимо, чтобы она была не менее чем на единицу меньше по абсолютному значению, чем ДБ в рассматриваемом диапазоне, если нулевые диапазоны идут подряд.
Величины 2, 4, 6 и 9 при замене ДБ = ± оо являются предпочтительными, так как соответствуют превышению вероятности одного состояния над вероятностью другого в «круглое» число раз: в 3, 6, 20 и 50. Кроме того, величины 4, 6 и 9 являются при округлении ДБ с точностью до единицы предпороговыми для принятия решения с заданной вероятностью ошибки не более ю % 5 % и 1 %. Нежелательно, чтобы решение с такой надежностью принималось на основании одного признака. По этим же соображениям нигде величина ДБ не должна превышать 9 (за исключением случая сочетания очень большого числа наблюдений и высоких диагностических порогов).
Примеры, иллюстрирующие все эти правила, рассмотрены в гл. 10.
При вычислении ДБ с преобразованием ДБ = ± оо по формуле (9.12) желательна последующая коррекция, особенно на краях распределений.
Надо отметить, что часто производят укрупнение диапазонов «на глаз». Например, можно стремиться во всех случаях выделять не более 8 — 12 диапазонов [47]. Некоторые исследователи считают удобным иметь во всех признаках по 4 диапазона [63, 148]. По-видимому, более строгие методы, описанные в подразделах 9.4 и 9.5, все же предпочтительнее.
9.5.2. Этап 8. Аппроксимация эмпирических распределений известными теоретическими является наиболее корректным способом сглаживания, однако он трудоемок и не всегда приводит к отысканию аппроксимирующего известного распределения. Применение этого метода для аппроксимации эмпирического распределения нормальным (что применяется чаще) или другим теоретическим при ПА рассмотрено в [47]. Здесь мы его не рассматриваем, хотя практически используем и рекомендуем.
Аппроксимации должна предшествовать оценка соответствия эмпирического распределения теоретическому.
Аппроксимация производится тем теоретическим распределением, от которого эмпирическое не отличается статистически значимо по критерию X Колмогорова — Смирнова. Обоснование такого подхода дано в [47].
9.5.3. Этап 9. Вычисление степени расхождения эмпирического и нормального распределений.
Если не доказаны статистически достоверные отличия рассматриваемого распределения от нормального или другого теоретического, то это может зависеть либо от того, что их действительно нет, либо от недостаточного числа наблюдений. Если, наоборот, доказаны отличия рассматриваемого распределения от нормального, то при большом числе наблюдений степень (величина) этих отличий может быть мала, несмотря на их достоверность.После проведения вычислений по оценке значимости отличий эмпирического распределения от теоретического (например, нормального) по алгоритму Колмогорова — Смирнова легко вычислить и величину расхождения эмпирического и теоретического распределения по следующей формуле [47]:
большом числе наблюдений небольшие отличия эмпирического распределения от теоретического, даже если они статистически значимы, могут не препятствовать аппроксимации первого вторым. По-видимому, вообще при рассмотрении вопроса о возможности аппроксимации данного эмпирического распределения теоретическим нужно исходить из того, что четкого формального решения он не имеет и его необходимо решать с учетом как формальных данных (достоверности и величины расхождений эмпирического и теоретического распределений), так и ряда неформальных соображений.
9.6. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ РАЗЛИЧИЙ ДВУХ ВЫБОРОК
Сравнивая две выборки, можно высказать предположение: выборки принадлежат к одной генеральной совокупности и, значит, различия между ними случайны.
Если вероятность этого мала (р не превышает 0,05), то наблюдаемые различия считаются неслучайными. Некоторые случаи, когда р не должно превышать 0,025, чтобы различия были признаны неслучайными, рассмотрены ниже в подразделе 9.6.1.
Следует учитывать, что в большинстве диагностических исследований недостаточно оценить только значимость различий двух выборок. Главной является оценка степени (величины) различий. Этот вопрос рассмотрен в разделе 9.3.
9.6.1. Этап 10. Выбор одностороннего или двустороннего критерия. Уровень значимости р = 0,05 или меньше считается достаточно малым, чтобы признать различия между выборками значимыми при так называемом одностороннем критерии.
Односторонние критерии рассчитаны на случай, когда проверяемая гипотеза, по отношению к альтернативной, формулируется так: «Генеральное среднее (щ) наблюдаемого признака для одной выборки не больше, чем для другой
Например, нас интересует, увеличивает ли лечебное средство число выживших животных в опыте. Если не увеличивает, то мы его отвергаем независимо от того, дает оно нулевой или отрицательный эффект.
Если проверяемая гипотеза формулируется иначе: «Генеральное среднее наблюдаемого признака для одной выборки равно генеральному среднему для другой выборки: |і! = \і2» (альтернатива: ф р2)> то применяются двусторонние критерии или односторонние, но уровень значимости ошибочного принятия нулевой гипотезы понижается вдвое: р — 0,025 или менее.
При проверяемой гипотезе Рі = \і2 целесообразно, если это возможно, учесть также фактический характер влияния исследуемого фактора на рассматриваемый признак. Это влияние также может быть двусторонним: в части наблюдений увеличение, в другой части — уменьшение значения рассматриваемого признака. Для ориентировки в этом вопросе на основе анализа самих выборок можно использовать оценку расхождения распределений, описанную в подразделе 9.4.1. При этом о двустороннем отличии можно думать, если существуют разности накопленных частот с противоположными знаками, т. е. максимальная разность больше нуля, а минимальная разность накопленных частот меньше нуля и особенно если она статистически значимо меньше нуля.
9.6.2. Применение непараметрических критериев. В большинстве медицинских исследований для оценки существенности различий используют главным образом параметрический критерий t Стьюдента, основанный на предположении, что сравниваемые выборки принадлежат к нормальным распределениям.
Между тем в медицинских наблюдениях распределения могут значительно отличаться от нормального. В этих случаях и даже тогда, когда просто неизвестно, являются ли распределения нормальными, применение критерия t, строго говоря, является необоснованным.Непараметрические критерии при распределениях, далеких от нормального, позволяют обнаружить существенные различия тогда, когда критерий t их не выявляет. При распределениях, близких к нормальному, непараметрические критерии также дают хороший результат, хотя и уступающий в этом случае критерию t. Наконец, привлекательной особенностью этих критериев является небольшая трудоемкость при их вычислении с помощью микрокалькулятора. В связи с этими преимуществами непараметрические критерии различий в последнее время получают все большее применение в биологии и медицине [10, 56, 82, 152, 187, 188, 190].
В пропаганде непараметрических критериев различий двух выборок автор участвует уже давно [47, 56]. В этой книге проблема непараметрического подхода к оценке значимости различий двух выборок рассмотрена с позиций распознавания. Круг используемых методов существенно сужен. Достаточно полно непараметрические критерии рассмотрены в [47, 56], где представлены 8 критериев для 4 различных случаев: 1) связанных (парных) выборок; 2) независимых выборок, когда оцениваются различия в средних тенденциях; 3) для оценки любых различий распределений либо 4) альтернативных различий, т. е. различий в распределениях, имеющих только две градации (бинарных).
Здесь мы рассматриваем только два критерия: X и ср. В сочетании алгоритмы вычисления этих двух критериев позволяют оценить величину значимости любых различий распределений в сгруппированном или несгруппированном ряду, найти оптимальное укрупнение их диапазонов и оценить более мощным критерием ф различия распределений после этого (см. раздел 9.7).
9.6.3. Критерий X Колмогорова-Смирнова предложен А. Н. Колмогоровым [197] для оценки значимости различий эмпирического и теоретического распределений и А.
Н. Смирновым для аналогичной оценки двух эмпирических распределений [152, 197]. Под наименованием «критерий Колмогорова - Смирнова» онПример применения критерия X Колмогорова — Смирнова х,— температура тела в градусах. Частоты даны в процентах

применяется как для той, так и для другой цели [127]. Применение этого критерия особенно удобно, когда речь идет об одновременной оценке значимости и величины расхождения распределений. Приводим методику применения критерия X в изложении Н. А. Плохинского (1970) [127] на примере, который аналогичен использованному им и представляет собой сгруппированные ряды, имеющие 8 диапазонов.
У детей с ОРВИ, к которым были вызваны педиатрические бригады СП, врачи бригад, в частности, измеряли температуру тела. В столбцах Л2 табл. 9.2 представлены данные о детях с УС, впоследствии госпитализированных в РО. В столбцах — данные о детях без УС, которые были госпитализированы в СО детских больниц. Из табл. 9.2 понятен ход вычислений разностей накопленных частот (столбец 9) и нахождения максимального модуля (абсолютного значения) этой разности по формуле:
где ІѴі — численность наблюдений в диапазонах, а щ — во всей выборке N2 и п2 — то же для А2. Максимальный модуль разности должен быть дан в этой формуле в долях единицы, а не в процентах. Соответственно в рассмотренном примере:

минимальная разность накопленных частот равна нулю, что позволяет считать отличия односторонними (см. подраздел 9.6.1) и пользоваться односторонним критерием, равным 1/2 двустороннего: р = 0,097/2 = 0,048. Следовательно, различия статистически значимы: температура тела у детей второй группы выше, чем первой.
В примере, представленном в табл. 9.2, критерий t также выявляет значимые различия средних (pt < 0,05).
В табл. 9.2 представлен пример вычисления X по сгруппированному ряду. Аналогично может быть построена расчетная таблица для несгруппированного ряда. При этом температура тела в каждом наблюдении будет считаться отдельной градацией признака «температура». Точность нахождения AF(xt)mах при этом будет наибольшей.
9.6.4. Точное вычисление значимости различий долей (процентов) по критерию ф (углового преобразования Фишера) [127, 141, 152, 188] предназначено для оценки различий в размерах долей двух выборок, в которых зарегистрирован интересующий нас эффект. Этот метод не имеет ограничений по численности выборок. В случае сравнения численных переменных (например, число дыханий) их необходимо перевести в бинарные, вычислив долю (обычно в процентах) наблюдений с рассматриваемым эффектом (например, с дыханием чаще 30 в минуту).
Принцип метода состоит в следующем. Если мы оцениваем частоту эффекта, принимающего только два значения («есть» и «нет»), то проценты сами по себе имеют распределение, отличающееся от нормального. Оно становится близким к нормальному, если процент Р заменить величиной:
где Р — процент, выраженный в долях единицы. Величину ф необходимо вычислить в радианах на инженерном микрокалькуляторе или определить по приложению 3.
Величина ф имеет следующие преимущества перед долей, выраженной в процентах: 1) поскольку распределение ф относительно близко к нормальному, мы получаем возможность использовать параметрические методы, предназначенные для нормальных распределений; 2) с помощью ф легко вычислить доверительные интервалы процентов, что при использовании других непараметрических методов невозможно [152, 188].
Рассмотрим методику оценки значимости различий долей (процентов) по методу ф. Зная разность двух величин фх и ф2 в сравниваемых выборках (фі всегда большая из двух величин) и объемы выборок nt и п2, можно вычислить соответствующий им аргумент нормального распределения ир:
по которому, используя приложение 4, определить статистическую значимость различий р для одностороннего критерия, а если метод используется при оценке различий в форме распределений, то для двустороннего критерия (см., например, рис. 9.3).
В примере, рассмотренном в табл. 9.2, показано, что среди 87 детей с УС (группа А2) у 47,1% температура тела не превышала 39 °С. Среди 59 детей без угрожающего состояния (группа At) у 67,8% температура тела не превышала 39 °С. Определим, можно ли считать, что в более тяжелой группе А2 температура тела не выше 39 °С наблюдалась реже, чем в группе Ах. Найдем по приложению 3 величины ф, соответствующие 47,1 % и 67,8 %, и выпишем все исходные данные:
Подставив их в формулу (9.17), получим значение аргумента нормального распределения ир:
По известной величине ир с помощью приложения 4 определяем, что рф = 0,006 для одностороннего критерия и р9 = 0,012 для двустороннего. Различия статистически значимы: температура тела не выше 39°С у детей с УС (Л2) встречалась реже, чем в более легкой группе Аѵ
Применение к этому же случаю ТКФ [47] дает близкий результат: рТКФ = = 0,007 (для одностороннего критерия).
Применение в подобном случае (см. табл. 9.2) критерия X для малых п при сравнении эмпирического и теоретического распределений (приложение 2) дает результат, близкий к полученному с помощью метода ср. При таком использовании приложения 2 мы условно считаем распределение с большим п теоретическим, а с меньшим п — эмпирическим.
Формально нет препятствий для применения метода ф в случае, когда доля наблюдений в одной из выборок равна нулю. Однако вычисление рф в этом случае, по-видимому, дает завышенный результат. Можно рекомендовать в тех случаях, когда доля (число) наблюдений с исследуемым эффектом в одной из выборок равна нулю, заменять нулевую долю какой-то малой долей, которая, например, в 10 раз меньше доли без эффекта.
9.6.5. Применение метода ф для определения доверительных границ долей (процентов). Доли (проценты) имеют доверительный интервал, зависящий от числа наблюдений. Например, если мы обнаружили, что у 1 больного из 20 наблюдался летальный исход, то можем ли мы утверждать: частота летального исхода равна Рли = 5 %. Метод ф позволяет вычислить 95 % доверительный интервал для этого значения Р. Использование метода ф с этой целью описано в ряде руководств [127, 152, 188].
Еще по теме 9.5. УМЕНЬШЕНИЕ СЛУЧАЙНЫХ ФЛЮКТУАЦИЙ В РАСПРЕДЕЛЕНИЯХ:
- Распределения случайных величин
- Случайная ошибка
- Обработка капитальных затрат, средних и предельных затрат, распределения по времени и неопределенности, и стимулы, свойственные распределению затрат
- Случайная ошибка
- Глава 17 Случайно обнаруженное образование надпочечника (инциденталома)
- 8. Первая помощь при случайном отравлении
- Уменьшение объема внеклеточной жидкости (гиповолемия)
- Б. Пассивное поступаяие паразитов с случайно загрязняемой пищей
- 4.4.1. Нарушения, характеризующиеся уменьшением количества костной ткани
- Уменьшение физиологической потребности (V)
- 28.Уменьшенный желчный пузырь.