А. Планирование статистической значимости.
В связи с высокой стоимостью компьютерного времени, необходимого для корреляционного анализа, очень важно, чтобы необработанных данных было заведомо достаточно для получения результатов, позволяющих сделать значимые выводы как по качеству, так и по количеству.
Для этого необходимо, во-первых, иметь статистически достаточное число соединений в обучающей и экзаменуемой выборках. Обе эти выборки должны состоять, по крайней мере, из пяти членов для каждого дескриптора, включенного в уравнение регрессии. Так, если пространственные характеристики молекул в выборках остаются практически неизменными, то каждая выборка должна содержать как минимум десять соединений: пять для дескриптора — коэффициента распределения и пять — для констант Гаммета. Таким образом, в общей сложности необходимо иметь двадцать разных соединений, хотя и родственных химически и структурно, причем эти соединения должны содержать заместители, охватывающие широкий ряд значений двух выбранных дескрипторов. Численные значения констант Гаммета и логарифмов коэффициентов распределения для десяти соединений математически обрабатывают на компьютере по методу наименьших квадратов для определения величин коэффициентов (к).Результаты затем выражают через n, s и г, где п — число соединений, равное 10; s представляет собой стандартное отклонение регрессии, а г — коэффициент корреляции, который в идеальном случае должен быть равен 1,00, но удовлетворительным считают значения 0,95 и выше. Полученные таким образом коэффициенты (к) используют для второй выборки из 10 соединений (для этой половины компьютер для расчета не применяют). Если в результате получают такие же высокие значения г
Рис. 16.1. Взаимосвязь а-констант Гаммета и я-констант Хэнша некоторых наиболее распространенных заместителей [Craig, 1971; Redl, Cramer, Berkoff, 19741.
и низкие значения s, то значит задача решена, так как исследователю ясно, какие именно дескрипторы и в каком соотношении имеют существенное значение в корреляции структура — активность данной выборки веществ [Topliss, Costello, 1972; Hansch, Unger, Forsythe, 1973]. После этого можно переходить к изучению широкой серии соединений, члены которой значительно больше отличаются друг от друга, в том числе стерически. Однако, если для экзаменуемой выборки значения величин s и г будут не столь высоки, как для обучающей выборки, то необходимо пересмотреть постановку задачи и начать решать ее сначала.
При первичном отборе соединений для проведения множественного регрессионного анализа большую помощь может оказать о — я-диаграмма Крэйта (рис. 16.1). Для определения о/я-области максимальной активности заместители в соединениях представленного ряда должны быть выбраны в каждом из четырех квадратов.
При выборе дескрипторов регрессионного уравнения обычно проводят некоторые предварительные исследования. Если в выборке присутствуют два соединения, имеющие резко отличающиеся о-величины, но примерно одинаковую степень биологической активности (1/С), представляется очень удобным исключить значения о-констант и, следовательно, иметь дело с меньшей серией соединений. Однако этого не следует делать. Так, например, при изучении загрязнения озер было установлено токсическое действие на рыб ряда фенолов, значения рКа которых изменяются от 11 (слабые кислоты) до 5 (сильные кислоты). Оказалось, что токсичность соединений примерно пропорциональна log Р, а включение о-констант не улучшает результата и не позволяет получить удовлетворительные величины
s и г. Более тщательное исследование показало, что по мере снижения величины рКа степень ионизации фенола при биологических значениях pH возрастает, и это приводит к увеличению его токсичности в опытах, где фенолу не требуется преодолевать биологическую мембрану. Так как ион практически не способен переходить в неводную фазу, в опытах на интактных рыбах два эффекта ионизации практически гасили друг друга [Saarikoski, Viluksela, 1982].
Еще по теме А. Планирование статистической значимости.:
- Таблица 1.1. Терминология экспериментальных исследований
- 32. Подходы к пониманию термина «планирование псих. эксперим.». Планирование содержательное и формальное.
- ВВЕДЕНИЕ
- СПИСОК ЛИТЕРАТУРЫ
- ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
- Обоснование необходимости применения математических методов при проведении экспертизы КМП
- 3.2. Методы экспертных оценок КМП и их особенности в медицинской практике
- ГЛАВА 13 МОДЕЛЬ СИСТЕМЫ УПРАВЛЕНИЯ И УПРАВЛЕНЧЕСКОЙ ДЕЯТЕЛЬНОСТИ
- Современные подходы к оценке эффективности технологий в АГС.
- КРАТКОЕ РЕЗЮМЕ
- Оптимизация состава питательных сред
- А. Планирование статистической значимости.
- Репродуктивное здоровье девушек-подростков: состояние, проблемы и пути сохранения
- 3.3. Результаты лечения пациентов группы II
- 2.1.2.22. Планирование медицинского эксперимента и статистическая обработка результатов.