2.2.1. Величины и переменные — базовые понятия
Множество числовых исходов наблюдения в медицинском исследовании или в медико-биологическом эксперименте является случайными величинами.
Случайная величина — это такая величина, которая в результате опыта может принять то или иное значение, причем неизвестное заранее.
Например, рост и вес человека, число вызовов врача на дом, содержание гемоглобина в крови, уровень активности ферментов и т.д. Различают дискретные (прерывные) и непрерывные случайные величины.Дискретные случайные величины могут принимать некоторые определенные значения (счетное множество значений), например, число заболеваний, число вызовов врача, количество пораженных кариесом зубов. К непрерывным относятся такие величины, которые могут принимать в определенном интервале любые значения, например, температура тела, давление крови, концентрация вещества в биологической жидкости и пр.
Числовые значения, принимаемые случайной величиной, называются вариантами (или переменными).
Пусть дискретная случайная величина принимает значения . Вероятности этих значений .—Рп в большинстве случаев не одинаковы, но так как все п возможных значений дискретной случайной величины представляет полную систему, то сумма их вероятностей должна быть равна 1. Это соотношение называется условием нормировки и выражается формулой:
(2.1)
Если известно, какой вероятностью обладает каждое значение, то тем самым характеризуется закон распределения. вероятностей.
Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Закон распределения, или просто распределение вероятности случайной величины, является полной характеристикой, определяющей возможные значения этой величины и позволяющей сравнивать вероятности различных возможных значений. Закон распределения случайной величины может задаваться в виде таблицы, графика и формулы (аналитически).
Кроме закона распределения, дискретные и непрерывные случайные величины характеризуются числовыми характеристиками.
Массовые явления, изучаемые статистикой, состоят из однородных в определенном отношении единиц наблюдения. Совокупность таких относительно однородных, но индивидуально различных единиц, объединенных в отношении некоторых общих условий для группового изучения, называется статистической совокупностью, а число единиц совокупности — объемом совокупности.
Переменные — это то, что можно измерять, контролировать или что можно изменять в исследованиях. Переменные отличаются многими аспектами, особенно той ролью, которую они играют в исследованиях, шкалой измерения и т.д.
Зависимые и независимые переменные. Независимыми переменными называются переменные, которые варьируются исследователем, тогда как зависимые переменные — это переменные, которые измеряются или регистрируются.
Может показаться, что проведение этого различия создает путаницу в терминологии, поскольку, как говорят некоторые студенты, «все переменные зависят от чего- нибудь», Тем не менее, однажды отчетливо проведя это различие, вы поймете его необходимость.
Термины «зависимая и независимая переменная» применяются в основном в экспериментальном исследовании, где экспериментатор манипулирует некоторыми неременными, и в этом смысле они «независимы» от реакций, свойств, намерений и т.д. присущих объектам исследования. Некоторые другие переменные, как предполагается, должны «зависеть» от действий экспериментатора или от экспериментальных условий. Иными словами, зависимость проявляется в ответной реакции исследуемого объекта на посланное на него воздействие.
Отчасти в противоречии с данным разграничением понятий находится использование их в клинических исследованиях, где вы не варьируете независимые переменные, а только приписываете объекты к «экспериментальным группам», основываясь на некоторых их априорных свойствах. Например, если в эксперименте мужчины сравниваются с женщинами относительно числа лейкоцитов (WCC), содержащихся в крови, то «Пол» можно назвать независимой переменной, a WCC зависимой переменной.
Две или более переменных связаны (зависимы) между собой, если наблюдаемые значения этих переменных распределены согласованным образом.
Другими словами, переменные зависимы, если их значения систематическим образом согласованы друг с другом в имеющихся наблюдениях. Например, переменные «Пол» и «Число лейкоцитов» могли бы рассматриваться как зависимые, если бы большинство мужчин имело высокий уровень «Числа лейкоцитов», а большинство женщин — низкий, или наоборот. «Рост» связан с «Весом», потому, что обычно высокие индивиды тяжелее низких; «IQ» (коэффициент интеллекта) связан с «Количеством ошибок» в тесте, т.к. люди высоким значением IQ делают меньше ошибок и т.д.Шкалы измерений. Переменные различаются также тем «насколько хорошо» они могут быть измерены или, другими словами, как много измеряемой информации обеспечивает шкала их измерений. Очевидно, в каждом
измерении присутствует некоторая ошибка, определяющая границы «количества информации», которое можно получить в данном измерении. Другим фактором, определяющим количество информации, содержащейся в переменной, является тип шкалы, в которой проведено измерение. Различают следующие типы шкал:
a) номинальная;
b) порядковая (ординальная);
c) интервальная;
с!) относительная (шкала отношения).
Соответственно, имеем четыре типа переменных: номинальные, порядковые (ординальные), интервальные и относительные.
Номинальные переменные используются только для качественной классификации. Это означает, что данные переменные могут быть измерены только в терминах принадлежности к некоторым, существенно различным классам; при этом вы не сможете определить количество или упорядочить эти классы. Например, 2 индивидуума различимы в терминах переменной А (принадлежат к разным национальностям). Типичные примеры номинальных переменных — пол, национальноеть, цвет, город и т.д. Часто номинальные переменные называют категориальными.
Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав, какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют сказать «на сколько больше» или «на сколько меньше».
Порядковые переменные иногда также называют ординальными. Типичный пример порядковой переменной — социально-экономический статус семьи. Так, возможно, что статус семьи соответствует верхнему среднему уровню или выше среднего уровня, однако сказать, что разница между ними равна, скажем, 18% мы не сможем. Само но себе располо- - жение шкал в следующем порядке: номинальная, порядковая, интервальная является хорошим примером порядковой шкалы.Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Например, температура, измеренная в градусах Цельсия, образует интервальную шкалу: температура 40 градусов выше, чем температура 30 градусов, и увеличение температуры с 20 до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов.
Относительные переменные очень похожи на интервальные переменные. В дополнение ко всем свойствам переменных, измеренных в интервальной шкале, их характерной чертой является наличие определенной точки абсолютного нуля, таким образом, для этих переменных являются обоснованными предложения типа: х в два раза больше, чем у. Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура по Кельвину образует шкалу отношения, и вы можете не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения.
Заметим, что в большинстве статистических процедур не делается различия между свойствами интервальных шкал и шкал отношения.