Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.psy.msu.ru/science/public/gusev/gusev2000.pdf
Дата изменения: Tue Mar 6 00:39:33 2007
Дата индексирования: Tue Oct 2 03:06:31 2012
Кодировка: Windows-1251
А.Н.ГУСЕВ

ДИСПЕРСИОННЫЙ

АНАЛИЗ

В ЭКСПЕРИМЕНТАЛЬНОЙ ПСИХОЛОГИИ
УЧЕБНОЕ
Д
ПО НАПРАВЛЕНИЮ

ПОСОБИЕ

ЛЯ СТУДЕНТОВ ФАКУЛЬТЕТОВ ПСИХОЛОГИИ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ

521000 'ПСИХОЛОГИЯ'

У

ЧЕБНО-МЕТОДИЧЕСКИЙ КОЛЛЕКТОР

МОСКВА 2000



СИХОЛОГИЯ

'


УДК 159.938 ББК 88

Рекомендовано кафедрой психологии личности факультета психологии Московского государственного университета имени М.В.Ломоносова. Рецензенты: А.П.Кулаичев, кандидат физико-математических наук; А.Н.Кричевeц, доктор философских наук, кандидат физико-математических наук ; А.М.Черноризов, доктор психологических наук

Г962

Гусев А.Н. Дисперсионный анализ в экспериментальной психологии: Учебное пособие для студентов факультетов психологии высших учебных заведений по направлению 521000 'Психология' . М.: Учебно-методический коллектор 'Психология', 2000. 136 с.
ISBN 5-93692-015-1

В учебном пособии представлены современные методы дисперсионного анализа как мощного средства оценки факторных эффектов в психологических экспериментах. Кроме общего описания различных процедур дисперсионного анализа даны подробные рекомендации по использованию двух наиболее популярных среди отечественных психологов статистических систем Stadia и SPSS. Приведены примеры обработки данных психологических исследований методами однофакторного, многофакторного и многомерного дисперсионного анализа, показана специфика обработки данных факторных экспериментов с повторными измерениями. Рекомендуется студентам-психологам в качестве учебного пособия по курсу 'Математические методы в психологии', а также для самостоятельного изучения статистических методов обработки данных и анализа результатов. Кроме того, книга будет полезна психологам, проводящим эмпирические исследования, в которых оцениваются воздействия на психологические переменные различного рода факторных эффектов. ISBN 5-93692-015-1 ї УМК 'Психология', 2000. ї А.Н.Гусев, 2000.


Есть только один способ достижения счастья на этом земном шаре иметь ясное сознание или не иметь его вовсе. Огден Нэш

ПРЕДИСЛОВИЕ
Дисперсионный анализ (ДА) является мощным современным статистическим методом обработки и анализа экспериментальных данных в психологии, биологии, медицине и других науках. Он очень тесно связан с конкретной методологией планирования и проведения экспериментальных исследований. Вместе с тем, наш опыт общения с коллегами-психологами, студентами и аспирантами факультета психологии Московского государственного университета имени М.В.Ломоносова показал, что многие из них недостаточно уверенно владеют этим методом и поэтому зачастую просто боятся его использовать. Замысел данного учебного пособия возник у автора случайно и некоторым образом даже непроизвольно. Первоначальной предпосылкой его написания явилась, с одной стороны, большая личная неудовлетворенность той литературой, которая имеется на русском языке по применению дисперсионного анализа в практике научных исследований, в том числе в психологии. С другой стороны, в последнее десятилетие появились современные статистические системы, в которых представлены новые процедуры ДА. Однако, даже по фирменным описаниям этих статистических систем крайне сложно разобраться в специфике и многообразии предлагаемых вариантов обработки данных. У нас и у многих наших коллег возникали постоянные трудности с правильным пониманием многочисленных опций в процедурах ДА, появив-


4

шихся в различных статистических системах. Более того, целый ряд новых терминов, встречавшихся в их не очень-то подробных и содержательных описаниях, был нам просто незнаком. Попытки обратиться к доступным для нас специалистам-статистикам за разъяснениями не увенчались успехом, поскольку эти достаточно новые статистические процедуры ими были также еще детально не освоены. Особенно это касалось процедуры ДА с повторными измерениями. В то же время, судя по публикациям результатов экспериментальных исследований в большинстве солидных международных психологических журналов, использование современных процедур ДА стало не только нормой, но и обязательным требованием представления результатов. Кроме того, опыт общения с зарубежными коллегами-преподавателями показал нам, что обучение студентов основам ДА и его использованию с помощью современных компьютерных статистических систем стало обычным делом для многих ведущих университетов. К тому же в последние 57 лет появились и новые учебники по статистике для психологов, где нашли отражение самые современные варианты ДА. Таким образом, у нас появилась потребность систематизировать свои разрозненные записи о различных вариантах ДА в виде учебного пособия, чтобы в какой-то мере компенсировать указанные выше недостатки в подготовке студентов-психологов. Многочисленные консультации по использованию ДА в психологии, которые нам приходится давать и студентам, и своим коллегам-преподавателям, только убедили нас в необходимости издания пособия такого рода. Безусловно, мы не тешим себя надеждой, что нам удалось в достаточной степени полно и систематично изложить основы данной группы методов и рассмотреть все их нюансы и трудности. Тем не менее, нам представляется, что настоящая книга будет полезна тем, кто хочет разобраться в специфике использования ДА и получить рекомендации по работе с компьютерными статистическими системами. На последнем остановимся чуть подробнее. Мы выбрали две статистические системы, на примере которых показываем, как использовать различные варианты ДА. Это отечественная система


5

STADIA (профессиональная версия 6.0) и американская система SPSS (русская версия 8.01). Свой выбор мы сделали намеренно, по двум причинам. Во-первых, это наиболее распространенные среди психологов статистические системы для персональных компьютеров. Во-вторых, к ним имеется содержательная и доступная российскому пользователю литература (см.: Кулаичев, 1998; Тюрин, Макаров, 1998; Руководство пользователя. SPSS Base 8.0, 1998). Именно по причине большей доступности русскоязычной версии SPSS для отечественного пользователя мы приводим примеры обработки экспериментальных данных в версии SPSS 8.01, а не в более новых версиях. Наш собственный опыт работы с SPSS показал, что никаких принципиальных различий в использовании процедур ДА в системе SPSS, начиная с версии 8.0, по сравнению с версиями 9.0 и 10.0, нет. В новых версиях лишь немного изменились пункты основного меню, но это уже, как говорят психофизики, 'едва заметные различия', никак не влияющие на результаты вычислений. Хочется отметить, что работа по модификации отечественной статистической системы STADIA продолжается: в последние дни работы над рукописью нам стало известно, что ее автор А.П.Кулаичев дополнительно включил в набор процедур ДА вариант ДА с повторными измерениями и начал работу над алгоритмом многомерного ДА. Поэтому мы надеемся, что к моменту выхода данного учебного пособия психологи смогут получить доработанную версию STADIA. В заключение нам хотелось бы выразить искреннюю благодарность своим коллегам, которые явно или неявно способствовали работе над книгой. Это прежде всего С.А.Шапкин, с которым нам пришлось не раз 'продираться' через премудрости опций статистических пакетов и руководств к ним, а также А.П.Кулаичев, которому в течение многих лет приходилось отвечать на множество наших наивных и непрофессиональных вопросов. Кроме того, мы выражаем благодарность руководителю российского представительства фирмы SPSS в Москве Антону Ковтуну за предоставленную возможность работать со всеми версиями системы SPSS и их описаниями.


6

Большая благодарность И.В.Тимофееву за замечания, сделанные им после прочтения рукописи. В работе над учебным пособием нам помогла блестящая книга Дж.Хауэлла 'Статистические методы для психологов' (Howell, 1998). Особая благодарность нашим рецензентам кандидату физико-математических наук А.П.Кулаичеву, доктору философских наук, кандидату физико-математических. наук А.Н.Кричевцу и доктору психологических наук А.М.Черноризову за внимательное прочтение книги и сделанные замечания.


ГЛАВА 1
СУЩНОСТЬ
1.1. ОСНОВНЫЕ
И ЛОГИКА ДИСПЕРСИОННОГО АНАЛИЗА
ПОНЯТИЯ

Дисперсионный анализ, или ANOVA (аббревиатура английского выражения Analysis of Variance), давно приобрел статус одного из самых используемых методов статистического анализа в психологии. Популярность и полезность этой техники обработки эмпирических данных обусловлены по крайней мере двумя причинами. Во-первых, ANOVA, подобно t-критерию Стьюдента, позволяет оценить различия между выборочными средними; однако, в отличие от t-критерия, в нем нет ограничений на количество сравниваемых средних. Таким образом, вместо того, чтобы поставить вопрос о различии двух выборочных средних, мы можем оценить, различаются ли два, три четыре, пять или k средних. Во-вторых, ANOVA позволяет нам иметь дело с двумя или более независимыми переменными (признаками, факторами) одновременно, оценивая не только эффект каждой из них по отдельности, но и эффекты взаимодействия между ними. Впервые дисперсионный анализ (ДА) был разработан американским статистиком Р.Фишером (1925) для анализа результатов агротехнических опытов и затем усовершенствован многими его последователями. Как следует из названия метода, его суть состоит в разложении (анализе) дисперсии одной или нескольких переменных на составляющие компоненты, сравнивая которые друг с другом с помощью .-критерия, можно оценить ее (их) вклад в общую вариацию данных. Поскольку ДА является комплексным методом оценки


8

различных экспериментальных взаимодействий, он требует определенной группировки данных, из чего следует необходимость специальной организации (планирования) эмпирического исследования. Результаты психологических измерений, подвергаемые ДА, должны быть сгруппированы с учетом выделения определенных контролируемых в исследовании факторов (или возможного взаимодействия нескольких факторов) и количеством повторных наблюдений. Для применения ряда современных вариантов многофакторного ДА бывает необходима реализация достаточно сложных и трудоемких планов проведения эмпирического исследования (см., напр., Налимов, 1971; Kirk, 1995). Воспользуемся данными одного вымышленного психологического исследования, чтобы на конкретном примере показать, какую задачу решает ДА и ввести ряд необходимых терминов. Хотя наш пример касается лишь однофакторного ДА (см. следующий параграф), он, тем не менее, позволит описать ряд инвариантных понятий, важных для всего последующего изложения. В эксперименте изучалась зависимость величины времени реакции (ВР) от индивидуальных особенностей испытуемых (возраст, пол и др.) в задаче трехальтернативного выбора. В первую группу вошли испытуемые в возрасте 20 лет, во вторую 30 лет, в третью 40 лет. В табл. 1 (см. с.17) представлены полученные данные. В качестве зависимой переменной, или результативного признака, оценивалось ВР на целевой стимул. Предполагалось, что оно будет зависеть от возраста испытуемых, выступающего как причина или фактор, вызывающий изменение данного признака. Естественно, что факторов, влияющих на один или несколько признаков, может быть достаточно много. Однако, в эксперименте исследователя интересуют лишь некоторые из них. Они называются контролируемыми, или изучаемыми факторами, в отличие от других воздействий, которые тоже оказывают влияние на наблюдаемый признак, но не контролируются. Контролируемость фактора заключается в том, что исследователь задает (или выбирает) определенные градации его изменения, или уровни фактора. В нашем примере заданы 3 уровня изменения фактора возраст: 20, 30


9

и 40 лет. Вариант ДА с одним контролируемым фактором называется однофакторным ДА. Когда контролируемых факторов два или более, используют многофакторный ДА. В нашем исследовании дополнительными изучаемыми факторами могли быть пол, профессиональный опыт, время суток и др. В случае наличия более, чем одного фактора, появляется возможность оценить влияние на зависимую переменную межфакторного взаимодействия. Таким образом, ДА как метод обработки эмпирических данных позволяет установить факт влияния фактора на признак или так называемый главный эффект, а в том случае, если контролируемых факторов несколько, обнаружить и оценить их взаимодействие.

1.2. ЛИНЕЙНАЯ

МОДЕЛЬ ДИСПЕРСИОННОГО АНАЛИЗА

В основе ДА лежит обычная линейная модель. Следуя нашему примеру, положим, что mобщ. среднее ВР в популяции (генеральной совокупности) взрослых людей, tj обозначает дополнительный компонент, соответствующий изменению возраста испытуемых (т.е. насколько среднее j-го возраста отличается от среднего генеральной совокупности: tj = mj mобщ.), eij вклад уникальности конкретного (i-го) испытуемого или, как еще говорят, 'ошибка' линейной модели. Тогда линейная модель, описывающая результативность четвертого испытуемого первой группы, будет выглядеть следующим образом: X = mобщ. + (m1 - mобщ.) + e4,1 = mобщ. + t1 + e4,1 (1) 4,1 Это и есть та структурная модель, которая лежит в основе ДА. В более сложных вариантах ДА она может быть расширена, но основная идея остается той же. Например, допустим, что в среднем по популяции ВР=740 мс. Далее, у большой группы двадцатилетних людей, выполнявших подобную задачу, среднее ВР на 30 мс больше. И наконец, испытуемый ? 4 входит в группу людей, где средний показатель меньше среднего генеральной совокупности на 40 мс. Тогда его результативность по данному тесту будет равна: X = 740 + 30 - 40 = 730 мс. 4,1


10

Естественно, что мы так подобрали вымышленные статистические оценки, чтобы они соответствовали данным из табл. 1.

1.3. НУЛЕВАЯ

ГИПОТЕЗА В

ДА

В нашем примере проверяемой нулевой гипотезой будет предположение, что средние величины ВР в различных экспериментальных условиях будут одинаковы. Другими словами, если mобщ. представляет собой среднее по генеральной совокупности всех испытуемых, которые потенциально могли бы быть участниками нашего эксперимента, а m1, m2, m3 это популяционные средние для трех экспериментальных условий, то нулевая гипотеза выражается следующим образом: H0 : mобщ. = m1 = m2 = m3. (2) Альтернативной гипотезой (Н1) будет предположение о том, что по крайней мере одно среднее отличается от других. Таким образом, в узком смысле ДА это техника оценки наличия или отсутствия различий между выборочными средними. При оценке ложности H0 совершенно неважно, что послужило причиной: отличие двух или трех пар средних друг от друга. Используя при описании нулевой гипотезы термин 'генеральная совокупность', или 'популяция', мы должны подчеркнуть, что этот термин в контексте ДА означает не множество испытуемых или объектов, а множество численных значений определенного признака у этих испытуемых или объектов. Поэтому в ДА мы устанавливаем различие не между популяциями, а между средними значениями исследуемого признака, наблюдаемого (измеряемого) в разных популяциях. В этом смысле корректнее говорить о том, что среднее, полученное по оценкам некоторого признака при одном экспериментальном условии, будет больше или меньше, чем при другом условии. Это уточнение может показаться тривиальным, но это не так. Например, если мы исследуем возрастные особенности цветовых ощущений, то генеральные совокупности людей разного возраста будут, конечно же, отличаться друг от друга множеством характеристик, одна-


11

ко, совсем не обязательно, что шкальные значения цветовых ощущений будут у них разные.

1.4. МАТЕМАТИЧЕСКИЕ

ДОПУЩЕНИЯ

ДА

Как метод математической статистики, ДА основывается на ряде допущений о свойствах и параметрах распределения наблюдаемых случайных величин. Первое допущение ДА требует, чтобы значения признаков, соответствующих каждому уровню контролируемого фактора, были нормально распределены вокруг своего среднего. Графически это допущение можно представить в виде нескольких кривых плотностей вероятности, соответствующих нормальному распределению (см. рис. 1). Это, в свою очередь, означает, что каждое из этих распределений будет характеризоваться только двумя параметрами средним (m) и дисперсией (s2) полученных значений.

s1

2

s

2

2

s

3

2

s

4

2

s5

2

m

1

m

2

m

3

m

4

m

5

Рис. 1. Графическое представление распределений значений измеряемого признака, полученных при каждом из пяти уровней фактора (см. Хауэлл, 1998, с.302)

Второе допущение предполагает равенство дисперсий выборочных распределений, соответствующих каждому уровню контролируемого фактора, т.е. s12 = s22 = s32. Это допущение также называют требованием однородности, или гомогенности, дисперсий. Третье допущение касается независимости полученных наблюдений. Это предположение означает, что для любых двух наблюдений мы не можем предсказать по значению одного наблюдения значения другого. В нашем эксперименте данное предположение не выполнялось бы в том случае, если испытуемые одной группы, записав в ходе опыта последовательность предъявлявшихся стимулов, сообщили бы об этом испытуемым другой группы. Или одна и та же груп-


12

па испытуемых участвовала бы в эксперименте дважды: например, утром и вечером (фактор: 'время суток'). В этом случае более 'медленные' испытуемые, участвовавшие в опыте утром, в целом покажут и вечером бульшие значения времени реакции, а 'быстрые' будут работать вечером также быстрее. Соблюдение независимости наблюдений является важнейшей причиной, обуславливающей в факторном эксперименте необходимость отбора испытуемых в группы случайным образом. Несоблюдение независимости наблюдений может иметь серьезные последствия для результатов ДА.

1.5. ПОСЛЕДСТВИЯ

НАРУШЕНИЯ ДОПУЩЕНИЙ

ДА

Поскольку ДА является точной процедурой статистических расчетов, то, строго говоря, нарушения не могут не повлиять на точность конечных оценок достоверности различия средних. Тем не менее, принимая во внимание, что в реальных данных первые два допущения не всегда строго соблюдаются, математики проводили специальные исследования о влиянии возможных нарушений на результаты ДА. Здесь мы коротко опишем полученные результаты изучения устойчивости (или робастности) ДА и дадим соответствующие рекомендации (более подробно об этом см. Шеффе, 1980; Гласс, Стэнли, 1976; Хауэлл, 1998). По данным Г.Шеффе (1962) и др. исследователей (цит. по Гласс, Стэнли, 1976), влияние неоднородности дисперсий в однофакторном ДА на величину ошибки I рода показало, что вероятность ошибки зависит от размера выборок, числа уровней фактора и реального отношения выборочных дисперсий. Например, если при 3-х уровнях фактора число наблюдений в каждой группе, соответственно, было 9, 5 и 3, а соответствующие дисперсии 10, 10 и 30 (т.е. находились в отношении 1:1:3), то вероятность ошибки I рода равна 0.17, тогда как экспериментатор традиционно исходил из того, что она равна 0.05. И, следовательно, возрастает вероятность отбросить нулевую гипотезу, когда она действительно верна. Специальные расчеты, однако, показали, что влияние нарушения допущения о равенстве дисперсий может быть компенсировано, когда:


13

1) объемы выборок равны или отличаются незначительно; 2) используются выборки большого объема. Таким образом, ДА может быть устойчивым к неоднородности дисперсий и, если дисперсии выборочных групп отличаются не очень значительно и используются выборки равного объема, то его применение оказывается вполне корректным. Многочисленные исследования показали очень слабую чувствительность ДА к нарушению предположения о нормальности. Следовательно, нарушение предположения о нормальности имеет для ДА небольшое значение, и фактическая вероятность ошибки I рода практически не отличается от устанавливаемой экспериментатором.

1.6. КРИТЕРИИ

ПРОВЕРКИ ОДНОРОДНОСТИ ДИСПЕРСИЙ

В том случае, когда есть основания думать о неоднородности групповых дисперсий, следует воспользоваться одним из методов проверки. Поскольку такая проверка носит чисто технический характер, то мы лишь упомянем некоторые из критериев, используемых в современных статистических компьютерных программах, чтобы читатель, зная о них, мог, в принципе, ими воспользоваться. Критерий Бартлетта сильно чувствителен к предположению о нормальности распределений, поэтому его использование в известном смысле ограничено. Однако, как справедливо утверждают Дж.Гласс и Дж.Стэнли (1976), это позволяет его использовать как средство оценки нормальности. Критерий Шеффе не столь чувствителен к нарушению нормальности распределений, поэтому часто используется на практике. Достаточно часто в различных компьютерных программах применяется также критерий Ливиня, который не зависит от предположения о нормальности распределений.

1.7. ОБЩАЯ

ЛОГИКА

ДА

Логические основания, лежащие в основе ДА, просты, и их понимание не требует от психолога серьезной математической подготовки.


14

Пусть выполняются все допущения ДА и мы имеем несколько выборок с одинаковым числом наблюдений (ni), соответствующих уровням одного фактора1. Пока мы не будем делать никаких предположений о ложности или истинности нулевой гипотезы. Для любого уровня фактора дисперсия значений наблюдаемого признака будет оценкой дисперсии генеральной совокупности, из которой взяты эти значения. Но поскольку мы допустили, что все генеральные совокупности (соответствующие уровням исследуемого фактора) имеют одинаковые дисперсии, то они также являются оценками дисперсии общей генеральной совокупности всех значений признака в целом (s2total). Переходя к выборочным оценкам дисперсий генеральных совокупностей, заменим символ si2 на si2: (3) s12 = s12, s22 = s22, s32 = s32, ..., sk2 = sk2, где знак '=' означает, что si2 оценивается по si2, а k число уровней фактора. Для увеличения надежности оценки дисперсии общей генеральной совокупности усредним дисперсии отдельных выборок, и при принятом нами условии, что n1 = n2 = n3 = ... = nk, получим:



2 total 1

2 = stotal =

s12 + s22 + s33 + ... + sk2 2 = sWG k

.

(4)

Таким образом, среднее по всем выборочным оценкам дисперсий и будет наилучшей оценкой s2total1. В ДА эта одна из возможных оценок общей дисперсии признака получила на2 звание внутригрупповой дисперсии и обозначается как sWG (аббревиатура английского выражения within group внутригрупповой). Внутригрупповая дисперсия отражает ту часть вариации наблюдаемого признака, которая обусловлена влиянием случайных факторов и не зависит от влияния контролируемого фактора. Подчеркнем, что эта оценка не зависит от того, ложна 2 или истинна H0, т.к. sWG вычисляется как простое среднее арифметическое однородных s 2 1 ... s 2 k.
1 Как будет показано ниже, для ДА требование равенства числа наблюдений отнюдь не является обязательным.


15

Теперь обратимся к случаю, когда H0 верна. Если это так, то k выборок по n наблюдений можно рассматривать как k независимых выборок из одной и той же генеральной совокупности наблюдений. В таком случае мы можем использо2 вать другую оценку total . Мы можем оценить общую дисперсию через вариативность групповых средних относительно общего среднего. Из центральной предельной теоремы следует, что вариативность средних, взятых из одной генеральной совокупности, равна дисперсии генеральной совокупности, деленной на размер выборки:

S=
2 X



2 total

Отсюда следует, что вторая оценка дисперсии может быть вычислена следующим образом:

n

.

(5)
2 total 2

(6)



2 total 2

= S2 n = S
X

2 BG

.
2 total 2 2 S BG

называют межгрупповой дисЭту (вторую) оценку персией и обозначают как (аббревиатура английского выражения between groups межгрупповой). В отличие от внутригрупповой, межгрупповая дисперсия отражает не случайную, а систематическую вариацию, т.е. те различия в величине наблюдаемого признака, которые возникают под влиянием изучаемого фактора, уровням которого и соответствуют выделяемые группы. 2 В свою очередь s X оценивается следующим образом:
2 SX =


k

(X

total

- Xk )

2

k -1
total

,

(7)

где X

среднее арифметическое всех наблюдений,

X k отдельное выборочное среднее, а k число выборок.
Таким образом, общая дисперсия оценена двояко: (1) как среднее нескольких выборочных (по числу уровней фактора) дисперсий, и (2) как среднеквадратичное отклонение выборочных средних от общего среднего. Причем очевидно, что 2 первая оценка ( SWG ) не зависит от истинности или ложности


16
2 нулевой гипотезы, тогда как вторая ( S BG ) может быть адекватной оценкой общей дисперсии только при условии истинности нулевой гипотезы. Пример. Рассмотрим два простых числовых примера с вымышленными данными, подобранными специально для иллюстрации того, что происходит, когда нулевая гипотеза истинна или ложна. Допустим, что мы провели эксперимент с тремя группами испытуемых разного возраста (средний возраст в группах 20, 30 и 40 лет, соответственно). В каждой группе было по 10 человек, выполнявших тест на определение времени реакции (ВР) в условиях трехальтернативного выбора (см. табл. 1, 2). Случай 1: H0 верна. В случае истинности H0 (данные из табл. 1) все средние по трем группам равны: X 1 = X 2 = X 3 , и каждое значение ВР, взятое из любой выборки, соответствует одной генеральной совокупности. Оценим внутригрупповую дисперсию:

2 sWG

=

Далее вычислим межгрупповую дисперсию: сначала

4889 + 6006 + 4694 = 5196 . 3

(770 - 750)2 + (725 - 750)2 + (755 - 750)2 = 525 , 3 -1 2 2 и наконец sBG = s X n = 525 10 = 5250 .

s

2 X

=

Таким образом, две различные оценки общей дисперсии практически не различаются (сравните: 5196 против 5250), что и соответствует нашему исходному предположению об истинности H0. Случай 2: H0 ложна. Теперь предположим, что во втором эксперименте (данные из табл. 2) в одну из групп (например, в группу 2) попали испытуемые, ранее уже участвовавшие в таком же опыте по измерению ВР. Таким образом, это были хорошо тренированные испытуемые, поэтому мы можем ожидать, что у них в целом значения ВР будут меньше, чем в двух других группах. Для симуляции подобного эффекта мы уменьшили все значения ВР испытуемых группы 2 на 50 мс.


17 Таблица 1 Данные эксперимента по определению ВР для случая: H0 истинна
В Р г р у п п ы 1 , мс 63 0 78 0 83 0 73 0 68 0 78 0 83 0 83 0 78 0 83 0 10
i

n

В Р г р у п п ы 2 , мс 690 810 740 790 690 740 690 840 690 570 10 725 60 06

В Р г р у п п ы 3 , мс 76 0 76 0 86 0 81 0 66 0 81 0 66 0 81 0 71 0 71 0 10 75 5 46 94

N

to ta l

= 30 = 750

X

77 0 48 89

X

total

s12

s

2 total

= 5200

Таблица 2 Данные эксперимента по определению ВР для случая: H
ВР группы 1, мс 630 780 830 730 680 780 830 830 780 830 10
i
0

ложна

n

ВР группы 2, мс 640 760 690 740 640 690 640 790 640 520 10 675 6006

ВР группы 3, мс 760 760 860 810 660 810 660 810 710 710 10 755 4694

N

total

= 30

X

770 4889

X

total

= 733 мс = 6637

s

2 i

s

2 total

Так же оценим и в этом примере внутригрупповую дисперсию:
2 sWG

=

Очевидно, что внутригрупповая дисперсия не должна была измениться.

4889 + 6006 + 4694 = 5196 . 3


18

(770 - 733)2 + (675 - 733)2 + (755 - 733)2 = 2608.5 , 3 -1 2 2 и далее sBG = s X n = 2608.5 10 = 26085 .

Вычислим межгрупповую дисперсию: сначала

s

2 X

=

По сравнению с предыдущим примером межгрупповая дисперсия (в отличие от внутригрупповой!) возросла значительно, что отразило влияние различий между тремя групповыми средними. Таким образом, данные примеры показывают, и это мы 2 подчеркиваем особо, что S BG является не просто еще одной 2 оценкой дисперсии генеральной совокупности ( total ), но кроме этого и оценкой разброса самих выборочных средних. Другими словами, средние трех экспериментальных групп отличаются прежде всего не в силу случайной вариации величины ВР, а по причине более успешного выполнения данного теста тренированными испытуемыми группы 2. В заключение еще раз дадим краткую характеристику общей логики ДА. Для проверки H0 мы должны вычислить две 2 оценки дисперсии генеральной совокупности: sWG, которая не зависит от истинности или ложности нулевой гипотезы, 2 и S BG , зависящую от истинности нулевой гипотезы. Когда обе эти оценки хорошо согласуются, у нас нет оснований 2 отвергать H0. В случае их сильного расхождения (когда S BG 2 намного больше sWG ) одно или несколько средних отличаются друг от друга, и мы можем предположить, что варьируемый фактор внес существенный вклад в их различия. Тогда H0 должна быть отвергнута.


ГЛАВА 2
ОДНОФАКТОРНЫЙ
ДИСПЕРСИОННЫЙ АНАЛИЗ
В двух предыдущих примерах (см. гл. 1) мы имели дело с анализом данных типичного однофакторного эксперимента. Обратимся к этим данным еще раз и проделаем ДА до конца, т.е. строго проверим нулевую гипотезу и оценим ее статистическую достоверность. Для этого рассмотрим понятия .-отношения и степени свободы.

2.1. ПРОЦЕДУРА

ОЦЕНКИ

.-ОТНОШЕНИЯ

.-отношение, или критерий Фишера это статистика, рассчитываемая в ДА. Этот показатель характеризует сравнение дисперсии, обусловленной вариацией самих групповых средних относительно общего среднего, с дисперсией, обусловленной вариацией признака внутри каждой отдельной группы относительно среднего по группе. Однако, при вы2 числении .-отношения прямо не используются оценки S BG 2 и SWG , введенные нами ранее, а применяются несколько другие оценки, основанные на расчете соответствующих сумм квадратов и соотнесении их с соответствующим каждому источнику вариации числом степеней свободы. Рассмотрим все необходимые вычисления подробно. Напомним, что выборочная дисперсия признака вычисляется как средняя сумма квадратов отклонений каждого значения выборки от среднего:

s

2

=



(Xi - X ) N -1
i

2

=



d

2 i

N -1

, ,

(8) (9)

отсюда



d 2 = (N -1)

s

2


20

d и обозначает сумму квадратов соответствующих где i отклонений, и, естественно, также характеризует величину вариации признака относительно среднего. Отметим, что для получения несмещенной оценки выборочной дисперсии вместо N в формуле используют величину (N 1). Обратимся вновь к данным примера 1 (см. табл. 3).
Таблица 3 Результаты вычислений по данным примера 1
Группа 1 n 10
i
i



2

Группа 2 10 725 6006

Группа 3 10 755 4694 N
total

= 30 = 750

X
s

770 4889

X

total

2

2 stotal

= 5200



d

2 total 2 BG

=150800 , dftotal = 29

d

=10500 , dfBG = 2

2 dWG =140300 , dfWG = 27

^BG s2 ^2 sWG

= 5250 = 5389

F = 1.01

Используя последнюю формулу, легко рассчитать общую по всем трем группам сумму квадратов: Межгрупповую (или факторную) сумму квадратов (в отличие от общей суммы квадратов) рассчитывают по следующей формуле: 2



d

2 total

= (N

total

- 1)

2 stotal

= 29 5200 = 150800.



d

2 BG

= n


j =1

N

2 Xj -


j =1

N

где n число наблюдений в каждой группе, j знак суммирования квадратов средних по k группам, а i суммирования значений всех наблюдений в отдельности. Подставляя численные значения, получим:

Xi , N

(10)



d

2 BG

=10 (770 2 + 7252 + 7552 ) -

= 16885500 - 16875000 = 10500.

(22500)2 = 30


21

Внутригрупповую (или остаточную) сумму квадратов обычно вычисляют как разность между общей и межгрупповой суммой квадратов1: Далее следует определить число степеней свободы для межгрупповой и внутригрупповой вариаций наблюдений. Математически строгое введение понятия степени свободы достаточно трудно, поэтому мы дадим лишь его упрощенную трактовку, в соответствии с которой для некоторого множества наблюдений число степеней свободы соответствует числу не зависящих друг от друга наблюдений. Например, нам известно, что сумма пяти чисел равна 15. Первые четыре числа могут быть любыми: 1, 2, 3 и 4 или 10, 1, 20 и 3. Но, если сумма первых четырех чисел равна 10, а вторых 34, то, следовательно, в первом случае последнее пятое число должно быть только '5', а во втором равняться '-19'. Таким образом, последнее (пятое) число уже не является независимым. Следовательно, в данном числовом примере имеется 4 степени свободы, т.е. на единицу меньше общего количества чисел. Вернувшись к нашему примеру 1, где в исследовании участвовало 30 испытуемых, можно определить число степеней свободы для оценки общей дисперсии. Оно будет равно:



d

2 WG

=



d

2 total

-



d

2 BG

= 150800 -10500 = 140300.

df

total

=

N 1 = 30 1 = 29.

(11)

Обычно число степеней свободы обозначают df (аббревиатура от английского выражения degrees of freedom). Для оценки межгрупповой вариации число степеней свободы оценивается так:

df

BG

=

k 1 = 3 1 = 2,

(12)

т.е. равно числу уровней фактора (в нашем примере числу групп) минус 1.
1

Кроме того,

состоящую из трех сумм квадратов соответствующих групп наблюдений:



2 dWG

можно вычислить как общую сумму квадратов,
2 WG 2



2 dWG =



2 dWG1 +



d

+



d

2 WG3

2 2 = n s12 + n s2 + n s3 .


22

Для оценки внутригрупповой вариации число степеней свободы рассчитывается следующим образом: N k = 30 3 = 27. (13) Число 27 можно проинтерпретировать следующим образом: каждая группа, состоящая из 10 наблюдений, 'теряет' по 1 степени свободы, следовательно, данные по каждой группе имеют 9 степеней свободы, а групп 3, поэтому 9 Ч 3 = 27. Для контроля правильности вычислений следует помнить, что сумма степеней свободы для внутри- и межгрупповой вариации всегда равняется общему числу степеней свободы, т.е.

df

WG

=

df

total

= df

BG

+ df

WG

=

2 +27 = 29.

(14)

После вычисления сумм квадратов и расчета числа степеней свободы можно найти оценки межгрупповой ( внутригрупповой (

^2 sBG



^2 sWG

) дисперсий, входящих в .-отноше-

ние. Для этого полученные суммы квадратов делятся на соответствующее им число степеней свободы:

^ s

2 BG

=



d

2 BG

k -1

,

^ s

2 WG

=



d

2 WG

N -k

.

(15)

Искомая статистика дисперсионного анализа .-критерий выглядит как простое отношение этих двух дисперсий:

F=

^2 sBG ^2 sWG

.

(16)

Вычислим величину .-отношения для нашего примера 1:

F=

Еще раз напомним, что величина . представляет собой отношение оценки общей дисперсии, обусловленной воздействием некоторого общего для всей совокупности наблюдений фактора, к дисперсии, обусловленной вариацией наблюдений внутри отдельных групп, соответствующих уровням этого фактора.

5250 = 1.01. 5196


23

Далее необходимо сравнить найденное значение .-отношения с табличным значением (см. табл. Приложения). Иначе говоря, с помощью таблиц .-распределения определяется вероятность получения данной величины . путем его сопоставления с соответствующим выборочным распределением .-значений. При пользовании таблицами исследователь выбирает определенную доверительную вероятность (т.е. вероятность ошибки I рода), а затем ищет табличное значение .-критерия с учетом определенного ранее числа степеней свободы. Выберем в табл. Приложения уровень значимости p = 0.05, и на пересечении столбца 2 (т.е. две степени свободы у числителя) и строки 30 (это самое близкое значение к числу степеней свободы знаменателя) считаем критическое значение .-критерия 3.32. Найденное нами значение . меньше критического, следовательно у нас нет оснований отвергать нулевую гипотезу. Это означает, что исследуемый фактор (в нашем примере это возраст испытуемых) не оказывает статистически достоверного влияния на величину времени реакции. Результаты дисперсионного анализа обычно записываются в таблицу стандартного вида (см. табл. 4). В последнем столбце табл. 4 указывается уровень значимости, при котором нулевая гипотеза может быть отвергнута.
Таблица 4 Результаты дисперсионного анализа данных из примера 1
Источник вариации Межгрупповая Внутригрупповая Общая Степени свободы 27 2 29



d

2

^ s

2

F 1.01

P >0.05

10500 140300 150800

5250 5196

Далее вычислим величину .-отношения для примера 2 (см. табл. 5). Полученное в примере 2 значение . больше критического (.кр. = 3.32), следовательно нулевая гипотеза может быть отвергнута на уровне значимости p < 0.05.


24 Таблица 5 Результаты вычислений по данным из примера 2
Группа 1 n 10
i

Группа 2 10 675 6006

Группа 3 10 755 4694 N
total

= 30

X

770 4889

X

total

=733 мс = 6637

si2

2 stotal



d

2 total

=192467 , dftotal = 29

d

2 BG

=52167 ,

df

BG

=2

2 dWG =140300 , dfWG = 27

^2 sBG ^2 sWG

= 26083 = 5196

F = 5.02

Строго говоря, это означает, что по крайней мере одно из средних отличается от других. В нашем примере это отличие обусловлено влиянием фактора 'небрежности экспериментатора', случайно пригласившего дважды принять участие в эксперименте одних и тех же испытуемых. Для того, чтобы конкретно понять, какое (или какие) же среднее отличается от других, используют процедуры попарного сравнения средних.

2.2. ПРОЦЕДУРЫ

МНОЖЕСТВЕННОГО СРАВНЕНИЯ СРЕДНИХ В

ДА

Казалось бы, что большой проблемы с проведением такого сравнения нет достаточно воспользоваться t-критерием Стьюдента. Однако, оказывается, что с ростом количества сравниваемых средних происходит значительное увеличение вероятности ошибки I рода. Допустим, что мы сравниваем между собой 5 средних, и в силу случайной ошибки в одной из выборок, например, во 2-ой, ее среднее оказалось выше, чем в других. Для того, чтобы определить значимость различий между средними, нам нужно произвести попарные сравнения всех средних: X 1 - X 2 , X 1 - X 3 , X 1 - X 4 и т.д. всего

n(n - 1) или 10 пар сравнений. Из них в 5 случаях мы обнару2
жим, что X 2 больше остальных. Следовательно, в 50% сравнений мы допустим ошибку I рода, т.е. отвергнем нулевую


25

гипотезу, когда она в действительности верна, и сделаем заключение, что X 2 отличается от среднего по совокупности в целом. Таким образом, при увеличении количества сравниваемых средних в силу случайности выборки в принципе возрастает вероятность совершить ошибку I рода. Поэтому однородность всей совокупности, оцениваемой по нескольким выборочным средним, оказывается сильно зависимой от средней всего лишь одной выборки. В ДА для решения этой задачи используется другой подход, когда в оценку значимости различий между средними вносят вклад сразу все выборочные средние. Коротко данный подход можно выразить так: не слишком ли велика дисперсия средних, чтобы предположить, что все они являются средними выборок, взятых из одной генеральной совокупности? Одна из таких процедур была предложена самим Р.Фишером и получила название множественного t-критерия или теста минимально значимых различий Фишера1. Этот метод оценки парных различий между средними наряду с методами Шеффе и Бонферрони известен как наиболее либеральный из всех методов. Использование t-коэффициента Фишера оправдано лишь в том случае, если в результате проведенного ДА оценка .-отношения оказалась значима, а также при однородности дисперсий сравниваемых выборок. Расчет множественного t-критерия похож на вычисление t-критерия Стьюдента, однако вместо оценки дисперсии каждой выборки в отдельности в формуле участвует оценка внутригрупповой дисперсии, зависящая от вариабельности данных внутри всех групп, а не только двух сравниваемых:

tF =

Xi - X

j

^ s

2 WG

ni

+

^2 sWG
n
j

,
(17)

где ni и nj размер сравниваемых выборок (в нашем примере они равны).
1

Иногда данный коэффициент называют также защищенным t-критерием.


26

Используя данные из примера 2, оценим достоверность различий средних ВР по первой и второй группам:

t

F1 -2

=

X1 - X

2 2 WG

^ s

2 WG

n1

+

^ s

=

95 = 2.95. 32.2

n2

Для оценки достоверности полученных различий используем таблицу критических значений двухстороннего t-критерия Стьюдента и найдем критическое значение t-критерия при уровне достоверности 0.05 и количестве степеней свободы 18: tкр. = 2.1. Таким образом, мы (как и ожидалось) обнаружили статистически достоверные различия между сравниваемыми групповыми средними. Аналогичная оценка различий между средними первой и третьей групп (см. табл. 6) не обнаружила достоверных различий.
Таблица 6 Результаты парных сравнений средних из примера 2
Сравнение средних Группа 1 группа 2: t = 2.95 Группа 1 группа 3: t = 0.47 Статистический вывод: По Фишеру t t
F, кр. F, кр.

По Шеффе t t
Sh, кр. Sh, кр.

По Бонферрони t t
B, кр. B, кр.

= 2.1 = 2.1

= 2.58 = 2.58

= 2.43 = 2.43

1) есть различие между средними 1 и 2; 2) нет различия между средними 1 и 3.

1) есть различие между средними 1 и 2; 2) нет различия между средними 1 и 3.

1) есть различие между средними 1 и 2; 2) нет различия между средними 1 и 3.

Для более строгой оценки различий между средними используют также тест Шеффе. При использовании метода Шеффе требование статистической достоверности .-критерия не является обязательным, что делает его более универсальным. При оценке различий по Шеффе (tSh ) используется та же самая формула множественного t-критерия:


27

t=

Xi - X

j

^ s

2 WG

ni

+

^2 sWG
n
j

.
(18)

Однако, достоверность различия между средними оценивается иначе. Полученное значение (tSh) сравнивается с критическим, которое, в свою очередь, находится на основе критических значений .-критерия:

t

Sh , кр.

= F - (k - 1),

(19)

где k число уровней фактора. При сравнении групп 1 и 2 величина tSh будет также равна 2.95. По таблицам критерия Фишера находим соответствующее .кр. = 3.32, следовательно t Sh , кр . = 3.32 (3 - 1) = 2.58. Таким образом, при использовании критерия Шеффе мы тоже обнаружили достоверность различия между средними первой и второй групп, хотя разница между найденной величиной tSh и соответствующим критическим значением уже не столь велика (0.37 против 0.85). Критерий Бонферрони (иногда этот критерий называют также тестом Данна Dunns test по имени ученого, формализовавшего его применение) можно считать хорошим компромиссом между двумя рассмотренными выше критериями. Для его использования рассчитывается множественный t-критерий. Однако, критическое значение t-критерия оценивается несколько сложнее. Оно зависит от количества сравниваемых пар средних. Нулевая гипотеза отвергается на уровне достоверности, вычисляемом как p/c, где p принятый уровень достоверности (например: 0.05 или 0.01), а c количество проводимых сравнений. Например, если мы хотим сравнить 2 пары средних, то нулевую гипотезу следует отвергать на уровне 0.05/2=0.025, а если сравниваются 3 пары, то на уровне 0.05/3=0.0167 и т.д. Естественно, что для использования критерия Бонферрони применяются не стандартные, а специальные таблицы (см., напр., Хауэлл, 1998) или аппроксимирующие формулы.


28

Расчеты, суммированные в таблице 6, показывают, что тест Фишера оказывается самым либеральным, тест Шеффе самым строгим, а тест Бонферрони занимает промежуточное положение. Таким образом, при принятии статистического решения на грани достоверности оцениваемых сравнений следует учитывать подобные возможности. Некоторые авторы (см. Хауэлл, 1995) предлагают еще один способ расчета критерия Шеффе: t-коэффициент Стьюдента возводится в квадрат и сравнивается с удвоенной величиной критического значения .-критерия. Следует отметить, что существуют и в различных статистических пакетах реально используются и другие критерии множественного сравнения средних. Например, в системе SPSS 8.0 их 18. Для более направленного и осмысленного выбора следует обратиться к специальной литературе (см., напр., Хауэлл, 1998). Кроме того, необходимо знать, что перед сравнением средних соответствующие выборки стоит оценить на однородность дисперсий, и, в случае обнаружения неоднородности, воспользоваться теми критериями, которые не требуют выполнения этого условия. К таковым относятся, например, критерии Тамхана, Даннета и ГеймсаХауэлла.

2.3. ДА

С ВЫБОРКАМИ НЕРАВНОГО РАЗМЕРА

В рассмотренных выше примерах число испытуемых в каждой группе, т.е. число наблюдений (измерений) в каждой выборке, было одинаковым. Это было сделано лишь из соображений удобства и простоты вычислений. В реальной практике обработки экспериментальных данных вследствие разных причин1 часто случается, что ДА подвергаются данные, в которых выборки, соответствующие различным уровням одного фактора, оказываются неодинакового размера. В этом случае изменения в вычислениях касаются лишь одной формулы формулы для оценки межгрупповой суммы квадратов. Данная модификация касается лишь одного
1 Нередко испытуемые выбывают из эксперимента или результаты нескольких опытов оказываются негодными.


29

параметра числа наблюдений в отдельных выборках, поэтому множитель n следует заменить на nj и внести его под знак суммы:



d

2 BG

=


j =1

k

2 X j nj -

Xi i =1 . N
N

2

(20)

2.4. ОЦЕНКА

СИЛЫ ФАКТОРНОГО ЭФФЕКТА

В том случае, если установлено статистически достоверное влияние контролируемого фактора на зависимую переменную, возможно количественно оценить силу этого влияния. Как правило, силу факторного влияния измеряют с помощью различных показателей, оценивающих отношение межгрупповой дисперсии (т.е. дисперсии, обусловленной влиянием фактора) к общей дисперсии. Существует несколько подобных показателей. Один из простейших 2 (эта квадрат):

=
2

d d

2 BG 2 total

.

(21)

Очевидно, что при полном отсутствии факторного эффекта D2 будет равно 0, а при значительном влиянии фактора стремиться к 1. В примере 1, где не было обнаружено основного эффекта, 2 этот показатель будет равен: 1пр. = 10500/150800 = 0.07. Ясно, что эта величина незначительно отличается от 0 всего 7% от общей дисперсии. В примере 2, где было достоверно обнаруже2 но наличие факторного эффекта, 2пр. = 52167/192467 = 0.27. Эта величина почти 4 раза больше, чем в первом примере 27% вариабельности данных обусловлено факторным эффектом. Этот показатель часто используется в качестве меры силы влияния фактора, хотя, как показывают специальные расчеты, часто его переоценивает. Более точной, несмещенной оценкой является другая статистика M2 (омега квадрат):


30

2 =



d



2 BG

- ( k - 1)
2 total

^2 sWG

d

+

^2 sWG

,

(22)

где k число уровней фактора. Вычислим и этот показатель для двух наших примеров:



2 1 пр.

=

10500 - (3 - 1) 5196 108 = = 0.0074, 150800 - 5196 145604 52167 - (3 - 1) 5196 41775 = = 0.23. 192467 - 5196 187271



2 2 пр.

=

Видно, что величина M2 в обеих случаях меньше, чем D2. Во многих руководствах по ДА и в некоторых компьютерных программах для оценки силы влияния фактора используется показатель Снедекора:

h=
2

^ s ^ s
2 BG

^2 + (n - 1) sWG ,

2 BG

^2 - sWG

(23)

где n численность наблюдений в отдельных группах. Если в группах неодинаковое число наблюдений, то n будет вычисляться сложнее:

n=

1 k-

N - 1



ni2 N ,

(24)

где k число уровней фактора, а N общее число наблюдений. Вычислим h2 Снедекора для двух наших примеров:

h

2

1n р .

= =

5250 - 5389 - 139 = = -0.0026 , 5250 + (10 - 1) 5389 53751 26083 - 5196 20887 = = 0.287. 26083 + (10 - 1) 5196 72847

h

2

2n р .

Как видно, оценки факторного влияния, рассчитанные тремя различными способами, в целом дают сходные ре-


31

зультаты: для первого примера они близки к нулю, для второго составляют 2327%. Последние свидетельствуют о существенном вкладе межгрупповой дисперсии в общую дисперсию.

2.5. О

ДВУХ МОДЕЛЯХ ДИСПЕРСИОННОГО АНАЛИЗА

При обработке данных однофакторного эксперимента наиболее разработанными и поэтому распространенными считаются две модели. Их различие обусловлено спецификой планирования самого эксперимента. В модели ДА с фиксированными эффектами исследователь намеренно устанавливает строго определенные уровни изучаемого фактора. Термин 'фиксированный эффект' в данном контексте имеет тот смысл, что самим исследователем фиксируется количество уровней фактора и различия между ними; при повторении эксперимента он (или другой исследователь) выберет те же самые уровни фактора. В модели со случайными эффектами уровни значения фактора выбираются исследователем случайно из широкого диапазона изменений фактора, и при повторных экспериментах, естественно, этот диапазон будет другим. Таким образом, данные модели отличаются между собой способом выбора уровней фактора, что, очевидно, в первую очередь влияет на возможность обобщения полученных экспериментальных результатов. Для ДА однофакторных экспериментов различие этих двух моделей не столь существенно, однако в многофакторном ДА оно может оказаться весьма важным.

КОНТРОЛЬНЫЕ

ВОПРОСЫ

1. Что понимается в ДА под зависимой переменной и фактором? 2. Что такое уровень контролируемого фактора? Чем отличаются модели ДА с фиксированными и случайными эффектами? 3. Каковы различия между однофакторным и многофакторным ДА?


32

4. Что такое главный эффект и межфакторное взаимодействие? 5. Какая структурная модель лежит в основе ДА? 6. Какая нулевая (H0) гипотеза проверяется в ДА? Сформулируйте альтернативную гипотезу (H1) ДА. 7. Сформулируйте три основных математических допущения ДА. 8. Каковы последствия нарушения допущений ДА? 9. Какие статистические критерии используются для оценки однородности дисперсий? Каким образом можно компенсировать влияние нарушения допущения об однородности дисперсий? 10. Что такое внутригрупповая дисперсия и как она оценивается? 11. Что такое межгрупповая дисперсия и как она оценивается? 12. Что оценивается с помощью .-отношения, какая гипотеза проверяется? Как рассчитывается .-отношение? 13. Каким образом вычислить межгрупповую и внутригрупповую суммы квадратов? 14. Что такое степень свободы и как определить число ^2 степеней свободы при оценке межгрупповой ( sBG ) и внут2 ^ ригрупповой ( sWG ) дисперсий? 15. Как определить статистическую значимость полученного .-отношения? 16. С какой целью применяют методы множественного сравнения средних? Почему использование t-критерия Стьюдента считается не вполне корректным? 17. Какие критерии парных сравнений используются на практике? В чем их особенность по сравнению с t-критерием Стьюдента? 18. Как оценивают силу факторного влияния? В чем смысл используемых показателей?

2.6. Р

АБОТА С ОДНОФАКТОРНЫМ ДИСПЕРСИОННЫМ

АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

STADIA 6.0

Обработаем данные примера, взятого из учебного пособия С.А.Шапкина (1997). Автор приводит данные исследования феномена так называемой 'выученной беспомощности'. Как извест-


33

но, данный феномен, исследуемый в рамках психологии личности, заключается в снижении у человека способности к решению задач, если перед этим он подвергался переживанию неуспеха в сходных задачах. В эксперименте приняли участие 3 группы испытуемых. Первая группа в предварительной серии проб пыталась решать неразрешимые анаграммы, в тестовой серии этой группе предъявлялись также анаграммы, но уже вполне разрешимые. Второй группе испытуемых в предварительной серии также предлагались неразрешимые анаграммы, но в тестовой серии были предложены другие (разрешимые) задачи на установление закономерностей. Третья группа испытуемых (контрольная) в предварительной серии не подвергалась переживанию неуспеха им предлагались разрешимые анаграммы, а в тестовой серии они решали оба типа задач (анаграммы и задачи на установление закономерностей). Таким образом, мы имеем дело с однофакторным экспериментом, где зависимая переменная время решения экспериментальной задачи, а фактором является условие решения задач в тестовой серии, задаваемое в предварительной серии (3 уровня фактора: 'однородное' условие, 'неоднородное' условие и контрольное условие). В таблице 7 приведены экспериментальные данные. Первый столбец порядковый номер испытуемого. Во втором экспериментальное условие (1, 2 и 3, соответственно). В третьем среднее время решения задачи в тестовой серии.
Таблица 7 Данные, полученные в эксперименте по изучению феномена 'выученной беспомощности'
? испыт уемого 1 2 3 4 5 6 7 8 9 10 11 12 Условие решения 1 1 1 1 2 2 2 2 3 3 3 3 Время решения, с 97 89 101 115 111 112 87 80 49 66 72 77


34

Для обработки данных в системе Stadia они заносятся в электронную таблицу в виде псевдоматрицы, т.е. столбцы не обязательно должны быть одинаковой длины как в нашем примере. При вводе чисел переменные (столбцы электронной таблицы) должны соответствовать различным уровням исследуемого фактора, а строки отдельным наблюдениям по каждому из уровней фактора. В таблице 8 данные представлены в том виде, в котором они должны быть введены в электронную таблицу.
Таблица 8 Ввод данных в электронную таблицу статистической системы Stadia

1 2 3 4

Однород. 97 89 101 115

Неоднород. 111 112 87 80

Контрол. 49 66 72 77

Для удобства работы переменным можно присвоить характерные имена, содержащие до 8 букв, например, как это сделано в таблице 8. После входа в меню статистических методов (.') следует выбрать раздел 'Дисперсионный анализ', а в нем опцию 'Однофакторный'. После этого в окне 'Анализ переменных' выбрать нужные вам переменные (в нашем случае их 3) или, если лишних нет, нажать на кнопку 'Все'. После нажатия на кнопку 'Утвердить' следует выбрать 'параметрический' метод ДА. Результаты анализа представляют собой стандартный набор рассчитанных показателей (см. табл. 9). Кроме того, STADIA в словесном виде формулирует результат проверки нулевой гипотезы. В конце таблицы результатов выдаются значения параметров однофакторной модели: общее среднее, отклонение от среднего, вызванное влиянием каждого из уровней фактора (эффект13), и соответствующие им значения доверительных интервалов. В случае наличия факторного эффекта (в нашем случае он имеет место) выдается таблица парных сравнений средних по Шеффе, где приводятся следующие параметры (по столбцам): разность средних значений, размах довери-


35

тельного интервала разности, уровень значимости нулевой гипотезы об отсутствии различий между средними и факт принятия альтернативной гипотезы. Далее исследователь может продолжить сравнение средних путем объединения их в отдельные группы или закончить анализ. Как следует из приведенных результатов ДА (см. табл. 9), мы обнаружили статистически значимое влияние фактора 'условие решения задачи' (р = 0.0096) на зависимую переменную 'время решения задачи'.Как показывает результат парных сравнений групповых средних по Шеффе, факторный эффект обусловлен превышением среднего времени решения задач в тестовой серии при 'однородном' и 'неоднородном' условиях по сравнению с 'контрольным' условием 34.5 и 31.5, соответственно. Различие среднего времени решения при 'однородном' и 'неоднородном' условиях оказалось статистически незначимым (3; р = 0.951).
Таблица 9 Пример выдачи результатов дисперсионного анализа статистической системой STADIA 6.1/prof
1-ФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ. Файл: learnhelp.std параметрический Источник Факт.1 Остат. Общая Сум.квадр 2.92E3 1.61E3 4.53E3 Ст.своб 2 9 11 Ср.квадр 1.46E3 179 412 Сила влияния 0.134

F(фактор1)=8.17, Значимость=0.0096, степ.своб = 2,9 Гипотеза 1: <Есть влияние фактора на отклик> Параметры модели: Среднее = 88, доверит.инт.=43.6 Эффект1 = 12.5, доверит.инт.=81.9 Эффект2 = 9.5, доверит.инт.=81.9 Эффект3 = -22, доверит.инт.=81.9 Парные сравнения Шеффе Переменные Разность Интервал 1 -2 3 27.5 1-3 34.5 27.5 2-3 31.5 27.5 Значим. 0.951 0.0167 0.0266 Гипотеза H1 Да Да


36

2.7. Р

АБОТА С ОДНОФАКТОРНЫМ ДИСПЕРСИОННЫМ

АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

SPSS 8.0.11

Данные заносятся в электронную таблицу Редактора Данных (SPSS Data Editor) в виде двух столбцов (переменных) одинаковой длины: в первый заносятся значения исследуемой переменной, полученные по каждому из N наблюдений, во второй значения уровня исследуемого фактора (для k фиксированных уровней это числа от 1 до k), соответствующие отдельным наблюдениям2. Таким образом, количество строк равно сумме всех наблюдений или сумме наблюдений, полученных по каждому из k уровней фактора. Если однофакторный ДА выполняется одновременно для нескольких переменных, то электронная таблица, соответственно, может содержать большее количество столбцов. В меню статистических методов Статистика (Statistics) следует выбрать группу методов Cравнение средних (Compare Means), а в ней Однофакторный дисперсионный анализ (OneWay ANOVA). В появившемся окошке слева будет представлен список всех переменных (столбцов), включенных в электронную таблицу. Из них нужно выбрать анализируемые переменные и перенести их в окно Список зависимых (Dependent List). Затем следует указать, в какой переменной заданы значения уровней исследуемого фактора и перенести ее в окно Фактор (.actor). Дополнительно можно заказать расчет дополнительных статистических показателей, нажав на кнопку Параметры (Options): к результатам добавятся показатели описательной статистики по каждой переменной и будет произведена проверка дисперсий сравниваемых групп на гомогенность по критерию Ливиня.
1 При описании приемов работы с SPSS мы используем вариант русской версии данной статистической системы SPSS 8. 0. 1 RUS. З а исключением однофакторного ДА, по сравнению с предыдущими версиями системы в процедурах ДА были сделаны существенные изменения. Для тех, кто пользуется англоязычной версией системы, мы приводим в скобках оригинальные названия пунктов меню. 2 Форма представления данных в таблице 7 полностью соответствует тому, что требуется для их обработки в системе SPSS.


37

Кроме того SPSS позволяет оценить так называемые априорные контрасты. Если исследователь предполагает, что сравниваемые групповые средние представляют собой некоторый упорядоченный (в соответствии со значением уровня исследуемого фактора) ряд, то можно попробовать оценить характер соотношения между этими средними. Таким образом, расчет контрастов используется для выявления взаимосвязей между средними. Фактически контраст это линейная комбинация нескольких средних ( X i ) c коэффициентами ai:

a1 X 1 + a2 X 2 + ... + ak X k = 0 ,
где a1 + a2 + ... + ak = 0.

(25)

Таким образом, задав вид полинома, можно оценить характер соотношения между средними. Для этого нужно в опции Контрасты (Contrasts) выбрать пункт Полином (Polinomial) и в окошке Степень (Degree) указать вид проверяемой зависимости линейной, квадратической, кубической или др. Исследователь может также задать и произвольный набор коэффициентов. SPSS предполагает, что коэффициент, заданный первым, соответствует минимальному уровню фактора, второй второму по величине и т.д. Сумма коэффициентов должна быть равна 0. До или сразу после проведения однофакторного ДА исследователь может выбрать критерии для множественного сравнения средних или, как еще говорят, воспользоваться апостериорными критериями сравнения, или оценить апостериорные контрасты. Для это следует нажать на кнопку Апостериорные (Post Hoc). SPSS представляет 18 методов множественного сравнения средних. Можно выделить 2 типа таких статистических тестов: проверяющие разности между каждой парой средних и выделяющие однородные группы средних, которые не отличаются друг от друга. Наиболее часто используемыми являются методы Бонферрони и Тьюки. Кроме того, метод Тьюки также выделяет однородные группы сред-


38

них. При большом количестве сравниваемых средних более чувствительным считается метод Тьюки, при малом более предпочтителен метод Бонферрони. Оба метода требуют равенства групповых дисперсий. SPSS предоставляет 4 метода, допускающих неравенство дисперсий: ГеймсаХауэлла, Т2 Тамхана, Т3 Даннета и С Даннета. После того, как заданы все необходимые параметры, процедура One-Way ANOVA запускается нажатием на кнопку ОК. Ниже мы приводим результаты обработки данных предыдущего примера (см. табл. 10), чтобы у читателя была возможность сравнить выполнение процедуры однофакторного ДА в двух различных статистических системах. Также, как и в системе Stadia, в результирующих таблицах даны очень полезные показатели описательной статистики (см. табл. 10). Очень удобно, что по каждой группе (уровню фактора) даны средние значения самооценок (столбец Mean) это поможет исследователю правильно проинтерпретировать результаты парных сравнений, представленных ниже (см. табл. 13).
Таблица 10 Показатели описательной статистики
время решения задачи

Однородное Неоднородное Контрольное Итого

N 4 4 4 12

Среднее 100.50 97.50 66.00 88.00

Стд. Стд. отклонение ошибка 10.88 5.44 16.42 8.21 12.19 6.10 20.30 5.86

95% доверительный интервал для среднего Нижняя Верхняя граница граница 83.19 117.81 72.37 123.63 46.60 85.40 75.10 100.90

Минимум Максимум 89 115 80 112 49 77 49 115

Результаты теста Ливиня на гомогенность дисперсий выборок (1.413; р = 0.293) показывают, что одно из важных допущений ДА выполняется (см. табл. 11).


39 Таблица 11 Результаты проверки дисперсий на однородность
время решения задачи Статистика Ливиня 1.413 ст.св.1 ст.св.2 Знч. .293

2

9

Результаты, представленные в таблице 12, также показывают, что установлен статистически достоверный эффект фактора 'условие решения задачи' на время ее решения (. = 8.17; p = 0.009). Кроме того, анализируя результаты парных сравнений средних, представленные в таблице 13, можно увидеть, что факторный эффект обусловлен главным образом различиями времени решения при контрольном условии и двух других условиях (34.5 и 31.5, соответственно). Стоит обратить внимание на то, что тест ГеймсаХауэлла не обнаружил достоверных различий между 'неоднородным' и 'контрольным' условиями, тогда как по Бонферрони они оказались статистически достоверными. Полученное несоответствие свидетельствует, с одной стороны, об известной относительности статистических выводов, а с другой о необходимости осмысленно применять различные критерии адекватно имеющимся данным.
Таблица 12 Результирующая таблица ДА
время решения задачи Сумма квадратов 2922.000 1610.000 4532.000 ст.св. 2 9 11 Средний квадрат 1461.000 178.889 . 8.167 Знч. .009

Между группами Внутри групп Итого


40

Таблица 13 Результаты множественного сравнения средних по трем экспериментальным условиям (тесты Бонферрони и ГеймсаХауэлла)

Зависимая переменная: время решения задачи 95% доверительный интервал Нижняя Верхняя граница граница -24.74 30.74 6.76 62.24 -30.74 24.74 3.76 59.24 -62.24 -6.76 -59.24 -3.76 -28.60 34.60 9.34 59.66 -34.60 28.60 -.65 63.65 -59.66 -9.34 -63.65 .65

Текст

Бонферрони

(I) Условие решения задачи Однородное Неоднородное Контрольное

Геймс-Хауэлл

Однородное Неоднородное Контрольное

(J) Условие решения задачи Неоднородное Контрольное Однородное Контрольное Однородное Неоднородное Неоднородное Контрольное Однородное Контрольное Однородное Неоднородное

Средняя разность (I-J) 3.00 34.50* -3.00 31.50* -34.50* -34.50* -31.50* 50* 3.00 34.50* -3.00 -3.50 31.50 31.50 -34.50* -31.50

Стд. ошибка 9.458 9.458 9.458 9.458 9.458 9.458 9.458 9.458 9.458 9.458 9.458 9.458

Знч. 1.000 .016 1.000 .026 .016 .026 .951 .013 .951 .054 .013 .054

*. Средняя разность значима на .05 уровне.


41

ЗАДАНИЯ
1. Определите число степеней свободы для межгрупповой (

^2 sBG

) и внутригрупповой (

^2 sWG

) дисперсий в следую-

щих трех примерах:
? примера 1 2 3 Число уровней фактора (групп), k 3 4 2 Число наблюдений в группе, n 10 20 30

^2 sBG
? ? ?

^2 sWG
? ? ?

2. Используя следующие числовые данные и табл. Приложения, рассчитайте .-отношение и оцените его значимость:
n= Группа 1 10 Группа 2 10 Группа 3 10



d

2 total

= 382

d

2 BG

= 79

^2 s BG ^2 sWG

=? =?

F=?

3. Используя следующие числовые данные и табл. Приложения, рассчитайте .-отношение и оцените его значимость:
Группа 1 Группа 2 8 Группа 3 10



n=

9

d

2 total 2 BG

= 192

d

= 84

^2 sBG ^2 sWG

=? =?

F=?

4. С помощью одной из статистических систем проведите ДА данных, полученных в описанном ниже эксперименте.


42

Три группы испытуемых (опытные операторы-профессионалы, операторы-новички и студенты, не имевшие опыта операторской работы) выполняли задачу по слежению за движущимся объектом. По 10 опытам, проведенным с каждым испытуемым, было рассчитано среднее количество ошибок. Определите, зависит ли число ошибок от профессионального опыта испытуемых? КаОпытные операторы 3.13 3.25 3.64 3.4 2.59 1.97 3.16 4.22 1.36 3.47 Операторы-новички 1.39 5.38 4.07 3.87 4.37 3.79 3.33 5.39 3.37 4.74 Студенты 5.47 5.6 6.88 6.4 3.02 6.18 5.52 4.15 2.07 4.68

кие группы испытуемых значимо отличаются друг от друга по числу ошибок? 5. Используя результаты вычислений, полученных в задании 3, оцените силу влияния фактора, рассчитав показатели 2 (эта квадрат) и h2 (Снедекора). 6. Используя данные из задания 4, проверьте гипотезу об однородности дисперсий трех выборок с помощью одной из статистических систем.


ГЛАВА 3
ДВУХФАКТОРНЫЙ
3.1. ОСОБЕННОСТИ
ДИСПЕРСИОННЫЙ АНАЛИЗ

ДВУХФАКТОРНОГО

ДА

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным ДА нет. Многофакторный анализ1 не меняет общую логику ДА, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный ДА, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного анализа (в варианте ее компьютерного использования) несомненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивает влияние каждого из факторов и их взаимодействие. Общая схема двухфакторного эксперимента, данные которого обрабатываются ДА, представлена на рис. 2. Данные, подвергаемые многофакторному ДА, часто обозначают в соответствии с количеством факторов и их уровней. Например, схема, представленная на рис. 2, называется двухфакторным планом 2?3. Если в исследовании было 3 фактора (А: 2 уровня, В: 3 уровня и С: 2 уровня), то схема получит
1 В зарубежной литературе многофакторный анализ часто называется дисперсионным факторным анализом (.actorial Analysis of Variance), тем самым подчеркивается, что обрабатываются результаты многофакторных экспериментов. Отметим, что это название не следует путать с факторным анализом как самостоятельным методом многомерного анализа данных.


44
Взаимодействие факторов А и В

Фактор А: 2 уровня

Зависимая переменная ( xE)

Фактор В: 3 уровня

Прочие неучитываемые (случайные) факторы

Рис. 2. Схема двухфакторного эксперимента

название 2?3?2. В зарубежной литературе для обозначения многофакторных схем также используют термин 'n-way': для двухфакторного two-way, для трехфакторного three-way и т.д. Таким образом, название 'two-way 2?3 factorial analysis of variance' означает двухфакторный ДА с двумя уровнями первого фактора и тремя уровнями второго фактора. В психологических исследованиях учет межфакторного взаимодействия может иметь особое значение и даже представлять для психолога основной интерес, поскольку несложно представить тот случай, когда каждый из факторов в отдельности может не оказывать на исследуемую характеристику никакого влияния, а сочетание двух или трех факторов оказывает существенное и закономерное влияние. Такие интересные феномены, когда совместное влияние факторов нельзя объяснить влиянием каждого фактора в отдельности, и означают взаимодействие факторов. Например, в возрастной психологии известно множество феноменов, когда проявление определенной психологической характеристики можно наблюдать только в определенном возрасте (фактор 1) и только в конкретном социальном окружении (фактор 2), т.е. при определенном сочетании указанных факторов. Вспомним классические эксперименты, подтверждающие известный


45

психологический закон ЙерксаДодсона: задачи разной сложности (фактор 1) решаются при различном уровне мотивации (фактор 2), и только определенное сочетание сложности и мотивации позволяет достичь оптимального уровня исполнения. В современной когнитивной психологии нередки случаи, когда исследователи находят и закономерные трехфакторные взаимодействия.

3.2. ЛИНЕЙНАЯ

МОДЕЛЬ ДВУХФАКТОРНОГО

ДА

Линейная модель, лежащая в основе двухфакторного ДА, является простым распространением рассмотренной выше модели однофакторного ДА. Воспользуемся еще раз примером эксперимента по измерению ВР (см. гл. 1). Однако, примем во внимание, что в исследовании будет контролироваться еще один фактор пол испытуемого. Тогда, если mобщ. среднее ВР в популяции взрослых людей, tj дополнительный компонент, соответствующий влиянию возраста испытуемых (т.е. насколько среднее j-го возраста отличается от среднего генеральной совокупности: tj = mj mобщ.), tg компонент ВР, соответствующий влиянию пола испытуемого (т.е. насколько среднее ВР мужчин или женщин отличается от среднего генеральной совокупности: tg = mg mобщ.), asjg вклад межфакторного взаимодействия (возраст?пол), eijg вклад уникальности конкретного (i-го) испытуемого ('ошибка' линейной модели):

X

ijg



общ.

+ j + g + as jg + ijg .

(26)

Как видно из этой простой формулы, межфакторное взаимодействие (asjg ) является неотъемлемой частью результата измерения независимой переменной. Иногда его влияние может быть достаточно сильным, чтобы 'перевесить' влияние обоих изучаемых факторов. Например, представим, что изучается скорость чтения у детей разного возраста (фактор 1) в условиях разного социального окружения (фактор 2). Вполне вероятно, что некоторые дошкольники в силу присущей им стеснительности не смогут нормально выполнить предложенное им задание в окружении сверстников, т.е. опреде-


46

ленное взаимодействие факторов 'возраст?социальное окружение' почти полностью подавляет продуктивную деятельность ребенка.

3.3. П

РОБЛЕМА ВЗАИМОДЕЙСТВИЯ ФАКТОРОВ

Рассмотрим проблему взаимодействия факторов подробнее. Когда мы оцениваем взаимодействие двух факторов, то фактически нас интересует, будет ли одинаковым влияние на зависимую переменную одного из факторов на всех уровнях другого фактора. Очевидно, что, если это влияние неодинаково, то второй фактор каким-то образом опосредует влияние первого фактора и, следовательно, можно говорить о существовании взаимодействия между ними. Используя один вымышленный эксперимент по изучению словарного запаса у младших школьников, рассмотрим различные варианты возможных результатов. Пусть в нашем эксперименте школьникам 2-го класса, мальчикам и девочкам (фактор 1: пол ребенка), было предложено составить список знакомых им слов, относящимся к трем различным сферам жизни человека: домашнее хозяйство, природа и спорт (фактор 2: сфера жизни). Предполагается, что в силу специфики интересов у детей данного возраста мальчики и девочки могут обладать различным словарным запасом, относящимся к разным сферам жизни. Пример 1, результаты которого представлены на рис. 3, демонстрирует четкую зависимость количества воспроизведенных слов от пола ребенка и заданной в качестве образца сферы жизни. В силу особенностей интересов детей этой возрастной группы словарный запас мальчиков и девочек оказался различным в разных сферах жизни налицо эффект взаимодействия обоих контролируемых факторов. Пример 2 показывает другой возможный вариант результатов эксперимента, где также было обнаружено взаимодействие факторов (см. рис. 4). Эти результаты показывают, что словарный запас у девочек больше, чем у мальчиков, но это преимущество заметно отличается для различных сфер жизни. Таким образом, здесь также мы можем обнаружить взаимодействие двух факторов.


47
Кол-во слов

60

50

40

30

девочки мальчики

20

Дом. хоз-во

1

Природа

2

Спорт

3

Сфера жизни

Рис. 3. Результаты двухфакторного эксперимента по изучению словарного запаса у младших школьников: имеет место взаимодействие факторов 'пол?сфера жизни'

60
Кол-во слов

50

40

30

девочки мальчики

20

Дом. хоз-во

1

Природа

2

Спорт

3

Сфера жизни

Рис. 4. Результаты двухфакторного эксперимента по изучению словарного запаса у младших школьников: имеет место взаимодействие факторов 'пол?сфера жизни'

И, наконец, пример 3 демонстрирует отсутствие межфакторного взаимодействия (см. рис. 5). Фактическая парал-


48

лельность сплошной и пунктирной линий свидетельствует о том, что словарный запас у девочек больше, чем у мальчиков, причем это преимущество одинаково во всех сферах. Это и означает, что в данном примере влияние фактора 'пол' на словарный запас не зависит от того, в какой сфере жизни он оценивается. Таким образом, взаимодействие факторов 'пол?сфера жизни' не обнаруживается. Графический анализ результатов эксперимента на уровне средних арифметических является хорошим средством для формулирования предварительных гипотез, однако сам факт 'параллельности' (см. рис. 5) или 'перекрещенности' (см. рис. 3) двух кривых, естественно, не дает возможности достоверно и определенно говорить об установлении факта взаимодействия двух факторов. Нередко по графику можно переоценить или же недооценить факт межфакторного взаимодействия. Однако после проведения ДА бывает очень полезно обратиться к графическому изображению анализируемых зависимостей, чтобы более полно понять суть обнаруженных влияний факторов и/или межфакторного взаимодействия.
60
Кол-во слов

50

40

30
девочки мальчики

20

1 Дом. хоз-во

2 Природа

3 Спорт Сфера жизни

Рис. 5. Результаты двухфакторного эксперимента по изучению словарного запаса у младших школьников: отсутствует взаимодействие факторов 'пол?сфера жизни'


49

3.4. ОБРАБОТКА

ДАННЫХ ДВУХФАКТОРНОГО ЭКСПЕРИМЕНТА

Рассмотрим конкретный числовой пример с данными двухфакторного эксперимента и проведем все необходимые для выполнения двухфакторного ДА вычисления1. Воспользуемся данными эксперимента по исследованию зависимости кратковременной памяти от темпа предъявления слов и их длины (см. табл. 14). В этом эксперименте участвовало 6 различных групп испытуемых по 5 человек в каждой. С каждым испытуемым проводилось по 3 повторных опыта и их данные усреднялись. Первый контролируемый фактор (фактор А) длина тестового слова включал 3 уровня: 3, 5 и 7 букв. Второй фактор (фактор В) темп предъявления слов включал 2 уровня: низкий темп и высокий темп. До начала выполнения вычислений проделаем небольшой визуальный анализ полученных результатов (см. рис. 6). Представленные на рис. 6 результаты позволя8
Кол-во слов

7

6

5

Низкий темп Высокий темп

4

3

3

1

5

2

Рис. 6. Зависимость объема памяти от длины тестового слова и темпа его предъявления: ось X длина тестового слова; ось Y количество запомненных слов
1 Мы специально взяли пример с равным количеством наблюдений (испытуемых) для каждого уровня обоих факторов для удобства и простоты вычислений. Пример с неравным количеством наблюдений рассматриваться не будет, поскольку нам важно показать лишь общую логику вычислений в ДА, и мы надеемся, что современному психологу не придется что-то делать вручную, а не с помощью какой-либо статистической системы.

7 Длина слова

3


50 Таблица 14 Результаты эксперимента по исследованию кратковременной памяти
?? строк Фактор В -- темп пред-я 1 2 3 4 5 6 По группам (j) 7 По фактору А 8 По фактору B 9 В целом 10 Пояснения к таблице группах. n1--6 -- число испытуемых в отдельных группах. N
total

Фактор А -- длина тестового слова 3 буквы Низкий 4.8 3.2 3.1 3.9 3.8 n1 = 5 1 = 18.8 Высокий 7.5 7.8 9.2 7.3 5.8 n2 = 5 2 = 37.6 5 букв Низкий 5.3 4.1 3.9 4.7 5.0 n3 = 5 3 = 23.0 Высокий 6.0 4.2 3.8 4.8 5.2 n4 = 5 4 = 24.0 7 букв Низкий 7.2 6.8 5.4 5.9 6.3 n5 = 5 5 = 31.6 Высокий 3.8 3.2 4.8 3.7 3.3 n6 = 5 6 = 18.8

nA = 10

nA = 10

nA = 10

A1 = 56.4
nB = 15

A2 = 47.0

A3 = 50.4
nB = 15 B2 = 80.4

B1 = 73.4
= 30,
total

2 =153.8, stotal = 2.49. s total

2

Строки 15: число правильно запомненных слов в отдельных



1--6

-- с уммы правильно запомненных слов в отдельных группах. -- с уммы правильно запомненных слов,

A1--А3, В1--В3

соответствующие каждому уровню каждого фактора. N
total, 2 total, и stotal -- число испытуемых, сумма всех правильно

запомненных слов и их дисперсия, соответственно, по группе в целом.

ют предположить, что имела место зависимость успешности запоминания слов как от их длины, так и от скорости предъявления на экране. Более того, можно ожидать наличия эффекта взаимодействия этих факторов, т.е. при высоком темпе предъявления лучше запоминались короткие слова, тогда как при низком длинные. Попробуем, используя двухфакторный ДА, количественно проверить наши предположения.


51

До начала вычислений сформулируем статистические гипотезы: 1. Отдельно по фактору А: ћ H0: количество запомненных слов не зависит от длины слова, т.е. вариации X 3 , X 5 и X 7 случайны. ћ H1: количество запомненных слов зависит от длины слова, т.е. вариации X 3 , X 5 и X 7 обусловлены влиянием фактора А. 2. Отдельно по фактору В: ћ H0: количество запомненных слов не зависит от темпа и X в случайны. ћ H1: количество запомненных слов зависит от темпа предъявления слова, т.е. вариации X н и X в обусловлены влиянием фактора В. 3. Для взаимодействия факторов А и В: ћ H0: влияние фактора А на количество запомненных слов одинаково при разных темпах предъявления слова, и наоборот. ћ H1: влияние фактора А на количество запомненных слов различно при разных темпах предъявления слова, и наоборот. Сначала, как и в предыдущей части, рассчитаем общую по всем испытуемым сумму квадратов:
н

предъявления слова, т.е. вариации X

Далее оценим межгрупповую (или общую факторную) сумму квадратов:



d

2 total

2 = (N - 1) stotal = 29 2.49 = 72.21.


=

d

2 BG

=

n
k

(

Xi)

2

( -


i =1

N

Xi )

2

j =1

N

=
(27)

18.82 + 37.62 + 23.0 2 + 24.02 + 31.62 + 18.82 - 5 (153.8) 2 - = 844.84 - 788.48 = 56.36, 30


52

где n число наблюдений в каждой группе, j знак суммирования средних по k группам, а i индекс суммирования значений всех наблюдений в отдельности. Фактически межгрупповая, или общая факторная сумма квадратов является оценкой вклада линейной двухфакторной модели (которую мы и используем!) в общую сумму квадратов. Поэтому ее иногда называют модельной. Внутригрупповую (или остаточную) сумму квадратов вычисляем как разность между общей факторной и межгрупповой суммами квадратов: Далее определяем суммы квадратов отклонений для факто2 d A мы усредняем данные по уровням ров А и В. При расчете фактора В, а при расчете



2 dWG =



d

2 total

-



d

2 BG

= 72.21 - 56.36 = 15.85.

(28)


N



d

2 B

по уровням фактора А.



2 dA =


a 1

(X A) nb

2

( -


i =1

Xi )

2

N

=
(29)

(56.42 + 47.02 + 50.42 ) - 788.48 = 5 2 = 793.01 - 788.48 = 4.53,

где b число уровней фактора B, X A наблюдения, сделанные по каждому уровню фактора А и усредненные по фактору В.


=

2 dB =

(X n a
b 1

B

)

2

( -


i =1

N

Xi )

2

N

=
(30)

(73.42 + 80.42 ) - 788.48 = 5 3 = 790.11 - 788.48 = 1.63,

где a число уровней фактора А, X B наблюдения, сделанные по каждому уровню фактора B и усредненные по фактору A.


53

Поскольку сумма квадратов межфакторного взаимодействия входит третьей составляющей в межгрупповую (общую факторную) сумму квадратов наряду с вкладом каждого из факторов, то мы ее вычисляем просто как разность:



d

2 AB

=

= 56.36 - (4.53 + 1.63) = 50.20.



d

2 BG

-(



2 dA +



2 dB ) =

(31)

Далее переходим к ды для каждой суммы 1. Для общей: df total 2. По фактору А: df

=

303?2 = 306 = 24. 6. Для межгрупповой, или общей факторной (или модельной): df BG = a?b1 = 3?21 = 5. Затем находим оценки дисперсий, входящих в .-отношения, поделив суммы квадратов на соответствующие значения степеней свободы: 1. 2. 3. 4. 5.

= N - 1 = 30 - 1 = 29. A = a - 1 = 3 - 1 = 2. 3. По фактору В: df B = b - 1 = 2 - 1 = 1. 4. Для взаимодействия факторов А и В: dfAB = dfA ЧdfB = 2Ч1= 2. 5. Для внутригрупповой или остаточной: dfWG = Na?b =

установлению числа степеней свобоквадратов:

^ s

2 A

= =

4.53 = 2.27. 2 1.63 = 1.63. 1 50.20 = 25.1. 2 15.85 = 0.66. 24 56.36 = 11.27. 5

^2 sB
^ s
2 AB

= = =

^2 sWG

^2 sBG


54

И наконец, вычисляем .-отношения и оцениваем их значимость, сравнивая с критическими из таблицы Приложения1: 1. FA =

значимости p < 0.05 мы отвергаем нулевую гипотезу и делаем вывод о статистической значимости влияния фактора А. Установив значимость фактора А, мы обнаружили один из двух главных эффектов 2, т.е. мы говорим о влиянии фактора 'длина слова' как такового, игнорируя все остальные условия эксперимента. 2. FB =

2.27 = 3.44. .A > .кр. 0.66

=

3.40, следовательно, на уровне

не значимости вую гипотезу и мости влияния предъявления' 3. FAB =

1.63 = 1.97. .A < .кр 0.66

.

=

4.26, следовательно, на уров-

p = 0.05 у нас нет оснований отвергать нулемы делаем вывод о статистической незначифактора В. Главный эффект фактора 'темп не обнаружен.
.

уровне значимости p < 0.05 мы отвергаем нулевую гипотезу и делаем вывод о статистической значимости влияния взаимодействия факторов А и В. 4. FBG =

25.1 = 38.03. .A > .кр 0.66

=

3.40, следовательно, на

11.27 = 17.08. 0.66

1 При расчете .-отношения следует у читывать, к акие выборки данных по группам испытуемых б ыли получены в эксперименте связанные или несвязанные. В данном случае в разных группах были разные испытуемые, следовательно несвязанные выборки. В зарубежной литературе экспериментальные планы, в которых одни и те же испытуемые повторно участвуют в разных экспериментальных условиях, называются планами с повторными измерениями (repeated-measures designs). 2 В отличие от термина главный эффект, когда мы оцениваем влияние одного фактора вне зависимости от уровней другого фактора, также используют термин простой эффект, когда мы рассматриваем влияние одного фактора только на одном из уровней другого. В нашем примере это рассмотреть зависимость количества запомненных слов от длины слова только при высоком темпе предъявления слов.


55

Как следует из результатов ДА (см. табл. 15), мы обнаружили один главный эффект: зависимость успешности запоминания от длины запоминаемого слова. Обнаружить зависимость успешности запоминания от темпа предъявления не удалось. Однако с высокой достоверностью был обнаружен эффект взаимодействия исследуемых факторов, т.е. количество запоминаемых слов зависит от сочетания длины слова и темпа его предъявления. Кроме того, мы обнаружили значимое соответствие двухфакторной модели имеющимся данным, о чем свидетельствует высокая достоверность вклада общей факторной компоненты в общую дисперсию оценок. Поэтому модель ДА, использованная нами для анализа данного примера, хорошо соответствует полученным данным. Хорошей мерой согласия модели и данных может быть отношение суммы квадратов, предсказанных моделью, к общей сумме квадратов:

объясняет 78% общей суммы квадратов. В зависимости от того, много это или мало, исследователь может добавлять в модель дополнительные факторы или ограничиться имеющимися.
Таблица 15 Результаты двухфакторного ДА
Источник вариации Главные эффекты По фактору А По фактору В Взаимодействие А Ч В Общая факторная (модель) Остаточная Общая Степени свободы, df 2 1 2 5 24 29

56,4 = 078 . В нашем случае модель . 72.12



@

2

^ s

2

F 3.44 1.97 38.03 17.08 -

P <0.05 >0.05 <0.01 <0.01 -

4.53 1.63 50.20 56.36 15.85 72.21

2.27 1.63 2.51 11.27 0.66 2.49

3.5. МНОЖЕСТВЕННЫЕ
В ДВУХФАКТОРНОМ

СРАВНЕНИЯ СРЕДНИХ

ДА

Как и в случае однофакторного ДА, методы множественного сравнения средних также необходимы, чтобы конкрет-


56

но выяснить, какие пары выборочных средних, относящихся к различным уровням обоих факторов, отличаются друг от друга. Все соответствующие рассуждения предыдущего раздела безусловно применимы и к двухфакторному варианту ДА. Тем не менее, в формулах есть небольшое различие. При необходимости выполнить вычисления вручную, а не с помощью одной из статистических систем, стоит обратить особое внимание на интерпретацию 'n' в знаменателе: это число определяется как произведение числа наблюдений в отдельной группе ( ni ) на число уровней данного фактора (ai или bi ).

3.6. О

ЦЕНКА ВЕЛИЧИНЫ ФАКТОРНОГО ЭФФЕКТА

Как и в предыдущем разделе, в качестве показателей силы факторного влияния могут быть рекомендованы индексы h2 и w2. Первый индекс рассчитывается аналогичным образом: оценивается отношение соответствующей суммы квадратов к общей сумме квадратов. Для расчета более сложного и адекватного индекса w2 необходимы дополнительные вычисления. Для эксперимента с фиксированными эффектами (как в нашем примере) это делается следующим образом:



2 A, B , AB

^2 A = ^

, B , AB 2 total

=

^ A, B , AB ^ A ^ B ^ AB ^ 2 + 2 + 2 + e2 ,

(32)

т.е. находится отношение скорректированной оценки дисперсии каждого фактора или их взаимодействия к скорректированной оценке общей дисперсии. Скорректированные оценки дисперсий рассчитываются так:

^2 A = ^2 B =

^2 ( a - 1 )( s A - n a b ^2 (b - 1 )( sB - n a b

^2 sWG ^2 sWG

)

,

(33)

)

,

(34)


57

^

2 AB

=

^2 ( a - 1)(b - 1)( s AB - n a b
.

^2 sWG

)

,

(35) (36)

^ e2 =

^2 sWG
2 A

Сделаем соответствующие расчеты для нашего примера:

^A 2 0.107 = 0.12. 1. = 2 = ^ total 0.922 ^ 2 0.032 2 B = 2B = = 0.03. 2. ^ total 0.922
3.
2 AB

^ 2 0.123 = 2AB = = 0.13. ^ total 0.922

Таким образом, сила влияния фактора А составляет 12%, фактора В 3%, а их межфакторного взаимодействия 13%. Для моделей со случайными или смешанными эффектами (когда один или несколько факторов имеют фиксированное количество уровней, а другой/другие случайное) формулы для расчета скорректированных оценок дисперсий несколько модифицируются (см., напр., Хауэлл, 1998).

3.7. ОЦЕНКА

ПРОСТЫХ ЭФФЕКТОВ

Простым эффектом фактора в отличие от основного эффекта называется эффект одного фактора, рассматриваемый только на одном из уровней другого фактора. Анализ простых факторных эффектов бывает очень полезным для более тщательного и подробного анализа причин уже установленного в ходе ДА межфакторного взаимодействия, когда исследователь хочет ответить на вопрос, в чем же выражается конкретно его эффект. Поскольку он может проявиться в большей или меньшей степени лишь на одном из уровней другого фактора, то вполне резонно посмотреть, на каком из них это взаимодействие имеет место и в какой степени. Ту же задачу выполняет и использование множественного сравнения средних.


58

Рассмотрим на нашем примере, как проявляется взаимодействие факторов А (длина слова) и В (темп предъявления) раздельно на каждом из уровней фактора В (см. табл. 16).
Таблица 16 Суммы по столбцам, взятые отдельно для каждого уровня факторов А из табл. 14.
Кол-во букв Темп Низкий (В1) Высокий (В2) Кол-во наблюдений (испытуемых) 3 буквы (А1) 18.8 37.6 5 5 букв (А2) 23.0 24.0 5 7 букв (А3) 31.6 18.8 5 Всего по фактору А 73.4 80.4 15Ч2=30

Оценим сумму квадратов по фактору А для первого уровня фактора В:



d

2 A- B1

Оценим сумму квадратов по фактору А для второго уровня фактора В:

(18.82 + 23.02 + 31.62 ) 73.42 = - = 375.2 - 359.17 = 17.03. 5 15

(37.62 + 24.02 + 18.82 ) 80.42 - = 5 15 = 468.64 - 430.94 = 37.70 d
2 A - B2

=

Далее рассчитаем все остальные показатели и сведем их стандартную таблицу (см. табл. 17).
Таблица 17 Результаты ДА простых эффектов для фактора А
Источник вариации Фактор А для условия В1 Фактор А для условия В2 Остаточная Степени свободы, df 2 2 24



d

2

^ s

2

F 12.91 28.56 -

P <0.01 <0.01 -

17.03 37.70 15.85

8.52 18.85 0.66


59

Как следует из результатов, представленных в таблице 17, влияние фактора А оказалось достоверно значимым на обоих уровнях фактора В, т.е. длина слова влияет на запоминание и при высоком, и при низком темпе предъявления слов. Рассмотрим также влияние фактора В при трех различных уровнях фактора А (см. табл. 18).
Суммы по столбцам, взятые отдельно для двух уровней фактора B из табл. 14
Темп Кол-во букв 3 буквы (А1) 5 букв (А2) 7 букв (А3) Кол-во наблюдений (испытуемых) Низкий (В1) 18.8 23.0 31.6 5 Высокий (В2) 37.6 24.0 18.8 5 Всего 56.4 47.0 50.4 10Ч3=30

Таблица 18

Оценим сумму квадратов по фактору В для первого уровня фактора А:



d

2 B - A1

=

(18.82 + 37.62 ) 56.42 - = 353.44 - 318.1 = 35.44 . 5 10

Оценим сумму квадратов по фактору В для второго уровня фактора А:

d

2 B - A2

=

(23.02 + 24.02 ) 47.02 - = 221.0 - 220.9 = 0.1 . 5 10

Оценим сумму квадратов по фактору В для третьего уровня фактора А:

d

2 B - A3

=

(31.62 + 18.82 ) 50.42 - = 270.4 - 254.02 = 16.38 . 5 15

Далее рассчитаем все остальные показатели и сведем их стандартную таблицу (см. табл. 19). Результаты, представленные в таблице 19, также показывают высокую достоверность влияния фактора В на первом и третьем уровнях фактора А, т.е. при условии предъявления ко-


60 Таблица 19 Результаты ДА простых эффектов для фактора В
Источник вариации Фактор В для условия А1 Фактор В для условия А2 Фактор В для условия А3 Остаточная Степени свободы, df 1 1 1 24



d

2

^ s

2

F 53.7 0.15 24.82 -

P <0.01 >0.05 <0.01 -

35.44 0.1 16.38 15.85

35.44 0.1 16.38 0.66

ротких и длинных слов темп предъявления оказывает значимое влияние на запоминание слов. В том же случае, когда использовались слова средней длины (5 букв), темп предъявления слов никак не влиял на их запоминание. Это достаточно интересный результат сам по себе, поскольку мы не обнаружили основного эффекта фактора В по эксперименту в целом, а, разложив его на составляющие, нашли значимые влияния. Результаты анализа простых эффектов фактора В могут в данном случае заставить исследователя задуматься о возможных психологических механизмах кратковременной памяти, тогда как простая формальная констатация отсутствия основного эффекта фактора В может 'замаскировать' имеющиеся результаты. Упомянув термин 'разложение на составляющие', уточним, из каких 'составляющих' состоит сумма квадратов простого эффекта одного из факторов в многофакторном эксперименте. Например, сумма квадратов простых эффектов фактора А (по уровням фактора В) равна сумме квадратов самого фактора А и межфакторного взаимодействия А?В:



d

2 A - B1

+



d

2 A- B2

=



2 dA +



d

2 AB

.

(37)

Таким образом, сумма простых эффектов фактора соответствует совокупности всех его влияний, т.е. сумме основного эффекта и межфакторного взаимодействия1. Аналогично оценкам простых эффектов каждого из факторов в отдельности, можно оценить простой эффект взаимодействия факторов. Это бывает полезно, когда, например,
1 Проделав простые арифметические вычисления, читатель может сам убедиться в справедливости этой формулы.


61

результаты трехфакторного ДА не обнаружили статистически достоверного эффекта межфакторного взаимодействия факторов А?В, но исследователь ожидает наличие такового на одном из уровней третьего фактора С. Вычисления, которые мы в данном случае опустим из-за их простоты и очевидности, в целом аналогичны проделанным выше. При необходимости читатель может обратиться к книге Хауэлла (1998), где подробно разобран соответствующий пример.

3.8. ДВУХФАКТОРНЫЙ ДА
РАЗМЕРА

С ВЫБОРКАМИ НЕРАВНОГО

Хотя чаще всего исследователь планирует эксперимент с выборками равного размера (n1 = n2 = n3 = ... = ni), в силу ряда причин это не всегда осуществимо: испытуемые могут заболеть или вообще отказаться от участия в опытах и т.п. Если в случае с однофакторным ДА проблем не возникает, то с многофакторным ДА имеют место сложности. Конечно, как рекомендуется в ряде руководств, можно выровнять количество испытуемых в группах, отбросив случайным образом 'лишних' из каждой группы. Однако, иногда это неразумно или вообще невозможно в силу исходной малочисленности выборок. Сложности возникают в связи с тем, что при выборках неравного размера строки, столбцы и эффекты межфакторного взаимодействия уже не являются независимыми. Не вдаваясь глубоко в эту проблему, ограничимся лишь ее обозначением. На наш взгляд, наилучшим выходом будет использование одной из современных статистических систем, где эта проблема находит свое решение. Однако, если у читателя возникнет желание разобраться в способах расчетов, мы можем отослать его к вполне доступной для психолога литературе (см. Лакин, 1980; Хауэлл, 1998; Гласс, Стенли, 1976).

3.9. СЛОЖНОСТИ ДА
ФАКТОРОВ

С БОЛЬШИМ КОЛИЧЕСТВОМ

Все основные принципиальные положения, касающиеся двухфакторного ДА, безусловно применимы и к обработке


62

трех-, четырех- и более факторных экспериментов. Тем не менее, сложность вычислений и вероятность появления в них ошибки значительно возрастают, поэтому мы рекомендуем коллегам-психологам использовать для реализации ДА одну из современных компьютерных статистических систем. Еще несколько слов посвятим некоторым важным терминам, использующимся в статистических системах, и описаниях к ним. Когда мы обрабатываем результаты двухфакторного эксперимента или рассматриваем двухфакторные взаимодействия в многофакторном эксперименте, то говорят о взаимодействии двух факторов (А?В, А?С или B?С) или взаимодействии первого порядка. Когда же мы рассматриваем взаимодействие сразу трех факторов (А?В?С), то его называют взаимодействием второго порядка. Содержательная интерпретация межфакторных взаимодействий более чем первого порядка может представлять для исследователя значительную проблему. Рассмотрим несколько формальных соображений по поводу трехфакторного взаимодействия А?В?С. Одним из вариантов объяснения этого взаимодействия может быть мысль о том, что взаимодействие факторов А?В само по себе взаимодействует с фактором С. Рассмотрим эту типичную ситуацию более подробно графически (см. рис. 7). Обратите внимание на то, что картина взаимодействия А?В на уровне С1 (левая часть рисунка) принципиально отличается от такового на уровне С2 (правая часть рисунка) фактически зависимость А от В изменилась на противоположную. Это и означает, что имеет место трехфакторное взаимодействие А?В?С. Но та же самая картина будет иметь место при взаимодействии А?С на различных уровнях В или В?С на различных уровнях А. Кроме того, можно предположить, что один из факторов А или В сам взаимодействует с фактором С, и тогда все будет выглядеть еще сложнее. Поэтому с формальной точки зрения трехфакторные взаимодействия достаточно непросто и неоднозначно интерпретируемы, и психологу требуются четкие содержательные гипотезы, чтобы сделать какой-либо определенный вывод. Казалось бы, что если в результате трехфакторного ДА получен всего один значимый основной эффект, то его ин-


63

терпретация проста: значит данный фактор влияет на независимую переменную. Однако эта простота ошибочна и мы не можем сделать однозначного и простого вывода о влиянии основного эффекта этого фактора, поскольку этот эффект зависит от двух других факторов тоже. Поэтому, даже при высокой значимости основного эффекта одного фактора, мы не можем только на основании этого результата идентифицировать источник различий между группами. В случае, когда мы обнаружили 12 основных эффекта и 12 межфакторных взаимодействия, нужно быть особенно осторожными и не делать поспешных выводов из формальных результатов ДА. Стоит особенно тщательно анализировать графики, показывающие взаимоотношение факторов и соотносить их с результатами парных сравнений средних. При планировании реальных экспериментов следует с особой осторожностью включать в экспериментальный план взаимодействия высших порядков и без особой необходимости не делать этого, поскольку post factum всегда возникает проблема интерпретации обнаруженных взаимодействий.
6 5 4 3 2 1
B1 B2
А

СССпвп

С1

6 ввв 5 4
1 2

С

2

3 2 1
B
1

А А

1

А

2

B

2

Рис. 7. Межфакторные взаимодействия второго порядка: проявление взаимодействия факторов А?В при двух различных уровнях фактора С: С1 слева; С2 справа; А1, А2, В1 и В2 выраженность признака при двух различных уровнях факторов А и В


64

КОНТРОЛЬНЫЕ

ВОПРОСЫ

1. Что такое многофакторный ДА, чем он отличается от однофакторного ДА? 2. В чем заключается межфакторное взаимодействие? Как показать графически наличие и отсутствие межфакторного взаимодействия? 3. Что стоит за обозначением 'трехфакторный план 3?3?2'? 4. Объясните, что означает английское название 'twoway 2?3 factorial analysis of variance'. 5. Какая математическая модель лежит в основе многофакторного ДА? Напишите формулу двухфакторной модели и объясните ее. 6. Сформулируйте статистические гипотезы (H0 и H1) для двухфакторного ДА. 7. Что такое общая сумма квадратов и как она рассчитывается? 8. Что стоит за межгрупповой (общей факторной) суммой квадратов и как она рассчитывается? 9. Какое значение имеет внутригрупповая (остаточная) сумма квадратов, как она рассчитывается? 10. Как рассчитываются суммы квадратов для факторов в двухфакторном ДА? 11. Как связаны между собой суммы квадратов факторов и сумма квадратов межфакторного взаимодействия? 12. Как оценить степени свободы для межфакторного взаимодействия и внутригрупповой дисперсии? 13. Что такое главный и простой эффекты фактора? 14. С помощью каких индексов оценивают силу факторных эффектов и межфакторного взаимодействия? 15. Для чего бывает полезно оценить простой факторный эффект или простой эффект факторного взаимодействия? 16. Что такое взаимодействие второго порядка? 17. В чем сложности интерпретации результатов многофакторных взаимодействий?


65

3.10. РАБОТА

С ДВУХФАКТОРНЫМ ДИСПЕРСИОННЫМ

АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

STADIA 6.0

В системе STADIA реализованы два варианта двухфакторного ДА с повторными измерениями и без повторных измерений. В соответствии с используемой моделью (т.е. имеющимися данными) данные в электронную таблицу заносятся по-разному. В случае более чем двух факторов предусмотрена отдельная процедура обработки данных, однако в ней не учитываются межфакторные взаимодействия. Вариант ДА без повторных измерений. В эксперименте без повторных измерений каждому сочетанию факторов соответствует всего одно измерение (а не n, как было в нашем примере)1. Поэтому исходные данные заносятся в электронную таблицу в виде матрицы размером n?m, столбцы которой должны соответствовать различным уровням первого фактора, строки различным уровням второго фактора, а каждая ячейка, соответственно, содержит только одно измерение. Рассмотрим конкретный пример. Двухфакторный план 5?5. В эксперименте изучалась зависимость эффективности обучения иностранному языку от методики обучения (фактор А: 5 уровней) и возраста обучаемых (фактор В: 5 уровней). В электронную таблицу заносятся числа, соответствующие количеству ошибок, допущенных каждым обучающимся (в каждой из 5 групп по одному человеку) по итогам окончательного тестирования полученных знаний (см. табл. 20).
Таблица 20 Результаты психолого-педагогического эксперимента по эффективности обучения иностранному языку
Возраст/Методика Возраст 1 Возраст 2 Возраст 3 Возраст 4 Возраст 5 Мет-ка 1 60 40 90 80 120 Мет-ка 2 90 70 30 40 110 Мет-ка 3 60 80 100 140 130 Мет-ка 4 20 30 70 40 90 Мет-ка 5 60 50 40 100 140

1 Как правило, вариант ДА без повторных измерений используют, когда число уровней обоих факторов достаточно велико (45). В противном случае интуитивно ясно, что никакая статистика при недостатке данных 'не сработает'.


66

После ввода данных и проверки его правильности переходим в меню статистических методов (.9). Там следует выбрать раздел 'Дисперсионный анализ', а в нем опцию 'Двухфакторный'. После этого в окне 'Анализ переменных' нужно выбрать все 5 переменных (если в таблице нет лишних, то нажать на кнопку 'Все'). После нажатия на кнопку 'Утвердить' следует выбрать первый вариант из предложенных моделей '1=неповторяемый' и нажать на соответствующую кнопку. Результаты анализа представляют собой стандартный набор показателей (см. табл. 21). Кроме того, STADIA в словесном виде формулирует результат проверки нулевых гипотез для каждого из двух факторов. В конце таблицы результатов выдаются значения параметров двухфакторной модели: общее среднее, отклонение от среднего, вызванное влиянием каждого из уровней фактора (эффекты 11 ... 15, 21 ... 25), и соответствующие им значения доверительных интервалов. В данной модели не оценивается межфакторное взаимодействие, что является ее серьезным ограничением. Как следует из приведенных в таблице результатов, был обнаружен основной эффект фактора В влияние возраста обучающихся. Основной эффект фактора А методика обучения оказался не значим, хотя величина .-отношения оказывается на грани статистической достоверности: . = 2.99, что чуть меньше .кр.= 3.01 (значимость = 0.0502) и в принципе можно также говорить о влиянии и этого фактора. Вариант ДА с повторными измерениями1. При обработке эксперимента с повторными измерениями каждому сочетанию уровней факторов соответствует несколько измерений независимой переменной. Исходные данные должны представлять собой псевдоматрицу, т.е. ее столбцы могут быть неодинаковой длины. Это означает, что на каждое сочетание факторов может приходиться различное количество измерений. Данные заносятся в электронную таблицу следующим образом: переменные (столбцы) соответствуют различным уровням обоих факторов и следуют в порядке изменения значения первого фактора: сначала все уровни первого фак1 Варианту ДА с повторными измерениями (Repeated-Measures ANOVA) посвящена ниже отдельная глава. В системе Stadia данный алгоритм ДА рассматривается как один из вариантов простого двухфакторного ДА.


67

тора для первого уровня второго фактора, затем все уровни первого фактора для второго уровня второго фактора и т.д.
Таблица 21 Пример выдачи результатов двухфакторного дисперсионного анализа без повторных измерений статистической системой STADIA 6.1/prof
2-ФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ. Файл: educ55 Факторный план: неповторяемый Источник Сум.квадр Ст.своб Ср.квадр Сила влияния Факт.1 Факт.2 Остат. Общая 7.1E3 1.34E4 9.5E3 3E4 4 4 16 24 1.78E3 3.36E3 594 1.25E3 -0.282 0.333

F(фактор1)=2.99, Значимость=0.0502, степ.своб = 4,16 Гипотеза 0: <Нет влияния фактора на отклик> F(фактор2)=5.65, Значимость=0.0051, степ.своб = 4,16 Гипотеза 1: <Есть влияние фактора на отклик> Параметры модели: Среднее = 75.2, доверит.инт.=13 Эффект1-1 = 2.8, доверит.инт.=34.4 Эффект1-2 = -7.2, доверит.инт.=34.4 Эффект1-3 = 26.8, доверит.инт.=34.4 Эффект1-4 = -25.2, доверит.инт.=34.4 Эффект1-5 = 2.8, доверит.инт.=34.4 Эффект2-1 = -17.2, доверит.инт.=34.4 Эффект2-2 = -21.2, доверит.инт.=34.4 Эффект2-3 = -9.2, доверит.инт.=34.4 Эффект2-4 = 4.8, доверит.инт.=34.4 Эффект2-5 = 42.8, доверит.инт.=34.4

Рассмотрим пример зависимости эффективности познавательной деятельности от курения и типа решаемой задачи (см. Хауэлл, 1998). Двухфакторный эксперимент 3?3. В опытах участвовали испытуемые, отличавшиеся дозой принятого


68

никотина (фактор А, 3 уровня: А1 курили перед опытом, А2 курили за 3 часа до опыта, А3 не курят вообще). Испытуемые выполняли 3 вида когнитивных задач (фактор В, 3 уровня: В1 опознание целевого стимула, В2 задача на кратковременную память, В3 работа на автотренажере). В таблице 22 представлен результат ввода данных в электронную таблицу STADIA.
Таблица 22 Результаты выполнения заданий в эксперименте по исследованию эффекта курения на различные виды познавательной деятельности

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

А1В1 9 8 12 10 7 10 9 11 8 10 8 10 8 11 10

А1В2 27 34 19 20 56 35 23 37 4 30 4 42 34 19 49

А1В3 15 2 2 14 5 0 16 14 9 17 15 9 3 15 13

А2В1 12 7 14 4 8 11 16 17 5 6 9 6 6 7 16

А2В2 48 29 34 6 18 63 9 54 28 71 60 54 51 25 49

А2В3 7 0 6 0 12 17 1 11 4 4 3 5 16 5 11

А3В1 8 8 9 1 9 7 16 19 1 1 22 12 18 8 10

А3В2 34 65 55 33 42 54 21 44 61 38 75 61 51 32 47

А3В3 3 2 0 0 6 2 0 6 4 1 0 0 6 2 3

Перед началом ДА следует проверить предположение о нормальности распределения данных и о равенстве дисперсий в отдельных группах. Для проведения этих тестов необходимо войти в главное меню статистических методов (.9) и выбрать раздел 'Параметрические тесты', в нем сначала пункт 2 'Гистограмма/нормальность', а затем пункт 4 'Тесты Стьюдента и Фишера'. При проверке нормальности распределения данных нужно обработать каждую переменную (выбрав последовательно из списка и нажав на кнопку 'Утвердить'). В ходе обработки STADIA оценит данные по трем статистическим критериям (КолмогороваСмирнова, омега-квадрат и хи-квадрат) и выдаст после каждого теста словесное заключение об отличии проверяемого распреде-


69

ления от нормального, а также построит соответствующие гистограммы. Для оценки равенства дисперсий (пункт 4 по критерию Фишера в списке переменных) можно нажать на кнопку 'Все', и тогда STADIA проведет попарное сравнение всех переменных автоматически. После проведения теста с каждой парой переменных появится словесное заключение о равенстве/различии дисперсий выборок. В силу простоты выполнения данных статистических процедур, мы не будем их описывать и сошлемся лишь на конечный результат проведения этих проверок: распределения всех 9 переменных оказались не отличающимися от нормального, а их дисперсии равны. В том случае, если предположения о нормальности и равенстве дисперсий нарушаются (гистограммы асимметричны, а дисперсия явно увеличивается с ростом среднего), можно использовать один стандартный прием сделать математическое преобразование с имеющимися данными. Обычно используют логарифмирование переменной или извлечения квадратного корня. Для выполнения преобразования переменных нужно выбрать в основном меню функций опцию 'Преобразования' (.8), а в ней пункт 1 'Стандартная функция'. Выбрав соответствующую кнопку '1 = LOG' или '6 = Xa', можно осуществить нужное преобразование над той переменной, где стоит курсор. После этого приступить к выполнению ДА. После проведенных проверок (или преобразований) приступаем непосредственно к проведению ДА. Как и в предыдущем примере, следует выбрать раздел 'Дисперсионный анализ', а в нем опцию 'Двухфакторный'. После этого в окне 'Анализ переменных' нужно выбрать все 9 переменных (если в таблице нет лишних, то нажать на кнопку 'Все'). После нажатия на кнопку 'Утвердить' следует выбрать второй вариант ДА с повторными измерениями ('Повторяемый') и модель с фиксированными эффектами ('2 = фиксирован. эффекты'). Кроме того (что очень важно!), в специальном окошке ('Градаций фактора1 = ) следует указать точное число уровней первого фактора, в нашем примере их 3. Результаты обработки (см. табл. 23) показывают, что обнаружен основной эффект фактора А, т.е. эффективность дея-


70

тельности испытуемых зависела от принятия дозы никотина. Второй основной эффект оказался не значимым. Однако взаимодействие обоих факторов было высоко достоверным, значит курение влияет на разные познавательные процессы по-разному.
Таблица 23 Пример выдачи результатов двухфакторного дисперсионного анализа c повторными измерениями статистической системой STADIA 6.1/prof
2-ФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ. Файл: smoke Факторный план: повторяемый, с фиксированными эффектами Источник Сум.квадр Ст.своб Ср.квадр Сила влияния Факт.1 Факт.2 Остат. Общая 2.87E4 355 2 2 4 126 134 1.43E4 177 682 108 338 0.0422 0.666 -0.0615

Межфакт. 2.73Е3 1.36E4 4.53E4

F(фактор1)=133, Значимость=0.0, степ.своб = 2,126 Гипотеза 1: <Есть влияние фактора на отклик> F(фактор2)=1.64, Значимость=0.195, степ.своб = 2,126 Гипотеза 0: <Нет влияния фактора на отклик> F(межфакт.)=6.33, Значимость=0.0002, степ.своб = 4,126 Гипотеза 1: <Есть влияние фактора на отклик> Параметры модели: Среднее = 569, доверит.инт.=61,4 Эффект1-1 = -552, доверит.инт.=159 Эффект1-1 = -550, доверит.инт.= 159 Эффект1-1 = -549, доверит.инт.= 159 Эффект2-1 = -559, доверит.инт.= 159 Эффект2-2 = -530, доверит.инт.= 159 Эффект2-3 = -562, доверит.инт.= 159

Статистическая система STADIA делает еще один полезный вид обработки данных для двухфакторного ДА с фик-


71

сированными или случайными эффектами. В том случае, если эффект межфакторного взаимодействия не обнаружен, то проводится дополнительный анализ по факторам А и В, но уже без учета их взаимодействия. Этот прием, как правило, дает более низкий уровень значимости нулевых гипотез, т.е. может повыситься вероятность обнаружения одного из факторных эффектов (как это было в предыдущем примере с основным эффектом фактора 2). Полученными результатами рекомендуется пользоваться, если уровень значимости гипотезы об отсутствии взаимодействия факторов достаточно высок (p значительно больше 0.05).

3.11. РАБОТА

С ДВУХФАКТОРНЫМ ДИСПЕРСИОННЫМ

АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

SPSS 8.0.1

Данные заносятся в электронную таблицу Редактора Данных (SPSS Data Editor) в виде двух или нескольких столбцов (переменных) одинаковой длины: в первый заносятся значения исследуемой переменной, полученные по каждому из N наблюдений, во второй значения уровней первого фактора (для a фиксированных уровней это числа от 1 до k), соответствующие отдельным наблюдениям, в третий значения уровней для второго фактора (для b фиксированных уровней это числа от 1 до m). Таким образом, количество строк равно сумме всех наблюдений или сумме наблюдений, полученных по каждому из k?m уровней факторов. Если двухфакторный ДА выполняется последовательно для нескольких переменных, то электронная таблица, соответственно, может содержать большее количество столбцов. Кроме того, в системе SPSS появляется еще одна дополнительная возможность обработки данных в процедуре многофакторного ДА. Это так называемая техника учета ковариации измеряемого признака с другим дополнительным признаком. Оставаясь в рамках нашего базового примера с исследованием зависимости кратковременной памяти от длины слов (см. разд. 3.4) и скорости их предъявления, предположим, что до эксперимента все испытуемые прошли стандартный тест на объем кратковременной памяти. Естественно предположить, что имеет место высокая корреляция (т.е.


72

линейная зависимость) между количеством правильно воспроизведенных букв испытуемыми каждой группы и результатами теста на кратковременную память. В этом случае (когда явная корреляция установлена!) в алгоритме расчетов ДА используется эта дополнительная переменная-ковариата. В ходе ДА метод использования переменной-ковариаты позволяет в ряде случаев увеличить величину основных эффектов и, тем самым, сделать их статистически значимыми. Таким образом, использование дополнительной информации повышает эффективность основной процедуры ДА. Возьмем результаты одного инженерно-психологического эксперимента и обработаем имеющиеся данные в системе SPSS 8.0.11. Воспользуемся данными из задания ? 4 предыдущей главы (см. с.4142). Данные (см. табл. 24) представляют собой количество ошибок, допущенных тремя группами испытуемых (фактор 1: 3 уровня) в эксперименте по слежению за движущимся объектом. Кроме того, введем еще один контролируемый фактор пол испытуемого (2 уровня). До начала выполнения вычислений проделаем небольшой визуальный анализ полученных результатов. Представленный на рис. 8 своеобразный 'параллелограмм ошибок' показывает, что фактор 1 (группа испытуемых), по-видимому, влиял на количество допущенных ошибок, поскольку виден рост количества ошибок от первой группы к третьей. Кроме того, можно предположить, что фактор 2 (пол испытуемых) также оказывал влияние на успешность деятельности (по крайней мере, это видно во второй группе). По поводу наличия межфакторного взаимодействия что-то определенное сказать трудно, но заранее отвергать его, по-видимому, нет оснований, поскольку в двух группах (новички и студенты) мужчины и женщины явно отличаются по количеству сделанных ошибок. Посмотрим, насколько наш пилотажный визуальный анализ будет соответствовать результатам ДА.
1 По сравнению с более ранними версиями SPSS, в версиях 8.0 и выше в процедурах ДА были сделаны значительные изменения. Тем не менее, м ы надеемся, что читатель, работавший с более ранними версиями данной системы, сможет без особого труда понять смысл сделанных изменений.


73
6
Кол-во ошибок

5

5

4

4
женщины мужчины

3

3 Опытные операторы

Новички

Студенты Группы испытуемых

Рис. 8. Результаты двухфакторного эксперимента по слежению за движущимся объектом: ось X группа испытуемых; ось Y количество допущенных ошибок

После ввода данных в меню статистических методов Статистика (Statistics) следует выбрать группу методов ОЛМ Общая линейная модель (General Linear Model), а ней вариант Обобщенная факторная... (General .actorial). В появившемся окошке слева будет представлен список всех переменных (столбцов), включенных в электронную таблицу. В нашем случае их 4: ? испытуемого, Ошибки, Группа и Пол. Из них нужно выбрать одну анализируемую переменную (Ошибки) и перенести ее в окно Зависимая переменная (Dependent Variable). Затем следует указать, в каких переменных заданы значения уровней исследуемых факторов, и перенести их в окно Фиксированные факторы (.ixed .actors) или Случайные факторы (Random .actors). В нашем примере имеется 2 фиксированных фактора Группа и Пол. В данном примере мы не используем переменную-ковариату, поэтому в окно Ковариаты (Covariates) не заносится никакая переменная. В следующем окне Взвешенный МНК (WLS Weight) можно задать переменную, значения которой придают различные веса результатам измерений, составляю-


74 Таблица 24 Данные эксперимента по слежению за движущимся объектом, внесенные в электронную таблицу SPSS
? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Ошибки 3.13 3.64 2.59 4.22 1.36 3.25 3.14 1.97 3.16 3.47 1.39 3.87 4.37 3.79 3.33 5.38 4.07 5.39 3.37 4.74 5.60 3.02 6.18 5.22 4.15 5.47 6.88 6.40 2.07 4.68 Группа 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 2.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 3.00 Пол 1.00 1.00 1.00 1.00 1.00 2.00 2.00 2.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 2.00 2.00 2.00 2.00 2.00 1.00 1.00 1.00 1.00 1.00 2.00 2.00 2.00 2.00 2.00

щим зависимую переменную. Эта возможность заключается в том, что числовые значения зависимой переменной могут быть трансформированы посредством процедуры взвешивания по методу наименьших квадратов: WLS Weight (Weighted Least-Squares). Для этого в данных можно указать отдельную переменную, с помощью которой результаты проведенных измерений получат различный вес. Подобная трансформация, как правило, выполняется при необходимости компенсировать различия в точности измерений используемых в исследовании переменных. Тем, кто не знаком с использованием данного приема, мы не рекомендуем его применение. Поскольку в нашем эксперименте анализируется толь-


75

ко одна зависимая переменная, то мы не используем данную возможность. Далее пользователь может определить варианты используемой модели ДА, для чего следует нажать кнопку Модель (Model). Полная факторная модель (.ull factorial) включает в себя оценки всех главных факторных эффектов, эффекты ковариат, парные взаимодействия всех факторов и не включает оценку взаимодействия между ковариатами. Чтобы задать другую необходимую пользователю конфигурацию модели (т.е. ограничить полную факторную модель), следует при выборе модели указать вариант Настраиваемая (Custom) и определить все необходимые компоненты модели. При обработке более чем двухфакторного эксперимента исследователь может ограничить уровень межфакторного взаимодействия, т.е. при расчетах отсечь взаимодействие факторов высшего порядка. В случае введенного ограничения любой не вычисляемый эффект взаимодействия будет объединен с остаточной суммой квадратов. В случае задания отсутствия взаимодействий будут рассчитываться только основные эффекты по каждому из факторов. Поскольку в текущем анализе нас интересуют не только основные эффекты, но и взаимодействие факторов, мы, без сомнения, выбираем полную факторную модель. Кроме того, пользователь имеет возможность выбрать один из трех методов разложения суммы квадратов и оценки остаточной суммы квадратов (основная процедура ДА) окно Сумма квадратов (Sum of squares). Для сбалансированных и несбалансированных моделей1, как правило, используется метод типа III, который также в литературе по ДА называют Уникальным (Unique). Поскольку этот метод инвариантен относительно числа наблюдений по отдельным уровням факторов, он чаще всего применяется на практике. При использовании ковариаты могут быть выбраны также три других
1 Напомним, что в так называемой сбалансированной модели ДА для каждого уровня фактора число наблюдений равно, для несбалансированной модели различно.


76

метода тип I (Иерархический, Hierarhical), тип II (Экспериментальный, Experimental) или тип IV. Для осмысленного выбора одного из них следует обратиться к специальной литературе, поскольку даже обширное описание процедур ДА, предлагаемое фирмой SPSS, не дает пользователю четких рецептов, и это не входит также в нашу задачу. Не очень опытным пользователям мы советуем выбрать тип III, заданный по умолчанию. Тем же, кто в достаточной степени освоил ДА и интересуется его нюансами, использование различных методов оценки суммы квадратов позволит оценить специфическое влияние переменных-ковариат на выраженность факторных эффектов и факторных взаимодействий, а также с большей адекватностью учесть особенности собственного экспериментального плана. Для нашего примера мы выбираем метод типа III; количество межфакторных взаимодействий ограничивать не стоит, поскольку у нас и так имеется лишь два фактора. Обычно в модель ДА включают свободный член, поэтому в окошке Включить в модель свободный член (Incude intercep in model) поставим 'галочку'. Нажав на кнопку Контрасты (Contrasts), пользователь может задать 5 различных видов оценки априорного контраста. Поскольку у нас нет конкретных априорных гипотез, то эту опцию мы не используем. Если хотя бы один из факторов включает больше, чем 2 уровня, то для него (для них) можно заказать оценку множественного сравнения средних, для чего следует нажать на кнопку Апостериори (Post Hoc), указать необходимый фактор и выбрать нужные статистические тесты. Мы указываем фактор Группа и выбираем один из тестов тест Шеффе. В качестве дополнительных статистических показателей закажем в меню Параметры (Options) расчет описательных статистик, оценку силы факторных эффектов и проверку однородности дисперсий. Рассмотрим результаты ДА, представленные в таблице 25. Первая часть результатов анализа представляет собой краткий


77

обзор введенных данных (Межобъектные факторы1, Between-Subject .actors). Далее тесты описательных статистик (Дескриптивные статистики, Descri ptive Statistics). Еще ниже результаты проверки равенства дисперсий (Levenes Test of Equality of Variances) . = 1.143, p = 0.365 (очевидно, что групповые дисперсии достоверно не отличаются друг от друга). Вторая часть непосредственно результаты ДА или оценка значимости факторных эффектов (Проверки межобъектных эффектов, Tests of Between-Subjects Effects). Значимым оказался основной эффект первого фактора 'Группа испытуемых'. Второй фактор ('Пол испытуемых'), и межфакторное взаимодействие оказались незначимыми. Интересно, что простой графический анализ результатов эксперимента, проведенный нами до выполнения ДА, явно не соответствует строгим результатам ДА: не подтвердился намек на основной эффект второго фактора, да и межфакторное взаимодействие оказалось незначимым. Приведенные ниже результаты тестов парных сравнений средних по группам испытуемых показывают (см. те строки, которые помечены 'звездочкой'), что факторный эффект обусловлен различиями между группой операторов-профессионалов и группой студентов. Попробуем исключить из расчетов эффект межфакторного взаимодействия (Maximum Interactions = None) и еще раз проведем ДА. Самая нижняя часть таблицы 25 показывает, что немного увеличился основной эффект первого и второго факторов (.GROUP = 6.79 против 6.64 и .SEX = 1.33 против 1.30). Таким образом, исключение межфакторного взаимодействия нам практически ничего не дало.

1 В настоящем учебном пособии мы используем, на наш взгляд, более удачное название межгрупповые факторы.


78 Таблица 25 Пример выдачи результатов двухфакторного дисперсионного анализа c повторными измерениями статистической системой SPSS 8.0.1

Однофакторный дисперсионный анализ
Межгрупповыеubjects Factors Between-S факторы
Группа испытуемых 1 2 3 Пол 1 испытуемого 2 Метка значения
Опер ато ры-пр офе ссионалы

N 10 10 10 15 15

Операторы-новички Студенты женщины мужчины
Де скр ип тив ны ст ат ис тик и Дескриптивные естатистики

За ви с и мая п е р е м енн а я: К о л и ч ес тв о ош иб о к Г р уппа и с п ыту е м ы х О п ера то р ы - п ро ф е с с ио на л ы По л и с п ы т уем о го ж енщ и ны мужч и н ы Ито г ж енщ и ны мужч и н ы Ито г ж енщ и ны мужч и н ы Ито г ж енщ и ны мужч и н ы Ито г Ср едне е 2.9880 2.998 0 2.993 0 3.350 0 4.5 9 0 0 3.970 0 4.83 4 0 5.1 0 0 0 4.9 67 0 3.72 40 4.229 3 3.9767 Стд. отк л онение 1.0 9 2 2 .5 89 4 .82 74 1.15 61 .872 6 1.1660 1 .255 6 1.89 42 1 .521 5 1.3 62 6 1.483 5 1.42 2 9 N 5 5 10 5 5 10 5 5 10 15 15 30

О п ера то р ы - нов и ч к и

Сту д е н ты

Ито г

Критерий Ливиня проверки равенства дисперсий. Зависимая переменная: Количество ошибок . 1.143 ст.св.1 5 ст.св.2 24 Знач. .365

Tests of Bфакторныхjects Effects Оценка etween-Sub эффектов
Зависимая переменная: Количество ошибок Сумма квадратов типа III 23.505
a

Источник Скорректированная модель Intercept ГРУППА ПОЛ ГРУППА * ПОЛ Ошибка Итог Скорректированный итог

ст.св. 5 1 2 1 2 24 30 29

Средний квадрат 4.701 474.416 9.742 1.91 5 1.053 1.467

. 3.204 323.358 6.640 1.305 .718

Знач. .023 .000 .005 .265 .498

Эта в квадрате .400 .931 .356 .052 .056

474.416 19.484 1.91 5 2.106 35.212 533.133 58.717

a. R квадрат = .400 (Скорректированный R квадрат = .275)


Таблица 25 ( продолжение)

Пояснения к основным терминам в таблице: 1. Кроме основных эффектов каждого фактора (ГРУППА, ПОЛ), SPSS также оценивает их совместный эффект (ГРУППАЧПОЛ). 2. Термин 'Скорректированная Модель (Corrected Model)' соответствует использованному выше термину 'общая факторная' или межгрупповая часть 'общей дисперсии'. Ошибка (Residual) обозначает 'остаточную' часть общей дисперсии, а Итог (Total) 'общую' дисперсию.

Апостериорные критерии
Множественные сравнения Зависимая переменная: Количество ошибок Шеффе 95% доверительный интервал Нижняя Верхняя граница граница -2.3901 .4361 -3.3871 -.5609 -.4361 2.3901 -2.4101 .4161 .5609 3.3871 -.4161 2.4101

(I) Группа испытуемых Операторы-профессионалы Операторы-новички Студенты

(J) Группа испытуемых Операторы-новички Студенты Операторы-профессионалы Студенты Операторы-профессионалы Операторы-новички

(I-J)-я разность средних -.9770 -1.9740* .9770 -.9970 1.9740* .9970

Стд. ошибка .542 .542 .542 .542 .542 .542

Знач. .218 .005 .218 .205 .005 .205

Основано на наблюденных средних. *. Разность средних значима на уровне .05.

Проверки факторных эффектов без учета межфакторного взаимодействия Зависимая переменная: Количество ошибок Сумма квадратов Источник ст.св. типа III Скорректированная 21.399 3 модель Свободный член 474.416 1 ГРУППА 19.484 2 ПОЛ 1.915 1 Ошибка 37.318 26 Итог 533.133 30 Корректированный итог 58.717 29

Средний квадрат 7.133 474. 9. 1. 1. 416 742 915 435

. 4.970 330.536 6.787 6.787 1.334 1.334

Знач. .007 .000 .004 .259

79


80

ЗАДАНИЯ
1. На рисунках 914 показаны соотношения средних значений зависимой переменной, полученные в шести разных двухфакторных экспериментах 3?2. Подумайте, в каких случаях можно предполагать наличие межфакторного взаимодействия, а в каких нет. 2. Заполните до конца таблицу ДА и выполните по .-критерию проверку нулевых гипотез для факторов А и В и их взаимодействия.
Источник вариации Степени свободы, d 4 5 ? 120 149
f

Главные эффекты

П о фактору А По фактору В Взаимодействие А Ч В Остаточная Общая



d

2

^ s
? ? ? ? ?

2

F ? ? ?

64.26 46.85 ? 1136.53 ?

3. Обработайте в одной из статистических систем данные следующего эксперимента 5?2 и дайте интерпретацию результатов анализа. Две группы испытуемых экстраверты и интраверты, отобранные предварительно по опроснику Г.Айзенка (фактор А: 2 уровня), участвовали в опытах по исследованию эффективности запоминания словесного материала в пяти различных стрессогенных условиях (фактор В: 5 уровней). В таблице 26 представлено количество правильно воспроизведенных слов для всех 10 сочетаний факторов.
Таблица 26 Данные для обработки к заданию 2
Стресс 1 Стресс 2 Стресс 3 Стресс 4 Стресс 5 Интр. Экстр. Интр. Экстр. Интр. Экстр. Интр. Экстр. Интр. Экстр. 9 8 7 10 11 14 12 20 10 21 8 6 9 7 13 11 11 16 19 19 6 4 6 8 8 18 16 16 14 17 8 6 6 10 6 14 11 15 5 15 10 7 6 44 14 13 9 18 10 22 4 6 11 7 11 22 23 16 11 16 6 5 6 10 13 17 12 20 14 22 5 7 3 6 13 16 10 22 15 22 7 9 8 7 10 12 19 14 11 18 7 7 7 7 11 11 11 19 11 21


81

4

4

3
В

3

2

1

В

В

2

2

1

В

2

1
А
1

1
А
2

А

3

Рис. 9

А1 Рис. 10

А

2

А

3

4

4 3

3

3 2
1

2

В В

В В

1

2

2 1
А А А

2

1
А
1

А

2

А

3

1

2

3

Рис. 11

Рис. 12

4

4

3

3

2
В
1

2
В
1

1
А
1

В А
2

2

1
А
1

В А
2

2

А

3

А

3

Рис. 13

Рис. 14

Рис. 914. Различные варианты зависимости измеряемой переменной от факторов А и В: ось X уровни фактора А; ось Y величина зависимой переменной в условных единицах; сплошная линия зависимость при первом уровне фактора В; пунктир при втором уровне фактора В


82

4. Обработайте в одной из статистических систем данные следующего трехфакторного эксперимента 2?3 (см. табл. 27) и дайте их интерпретацию. На компьютерном автотренажере изучались навыки вождения у двух групп испытуемых новичков и опытных водителей (фактор А: 2 уровня); испытуемые должны были проехать трассу трех классов сложности (фактор В: 3 уровня) в двух различных условиях вождения автомобиля днем и ночью (фактор С: 2 уровня). В таблице 27 представлено количество ошибок, допущенных водителями в каждом из условий. Предварительно постройте и проанализируйте графики, сформулируйте свои гипотезы о выраженности основного эффекта каждого из факторов и их взаимодействиях.
Таблица 27 Данные для обработки к заданию 4
Факторы А, В и С Новички День В2 23 15 21 13 2 6 8 12 Ночь В2 25 33 30 20 23 14 13 12

Опытные

В1 4 18 8 10 6 4 13 7

В3 16 27 23 14 20 15 8 17

В1 21 14 19 26 11 7 6 16

В3 32 42 46 40 17 16 25 12

5. Проведите ДА данных задания 4, последовательно исключив из анализа тройное, а затем двойное межфакторное взаимодействие. Как это повлияло на величину .-отношения для каждого из факторов? 6. Оцените силу факторных эффектов в примере упражнения 2. 7. По результатам проведенного ДА в упражнении 3 оцените степень адекватности линейной модели ДА полученным данным.


83

8. Найдите в литературе пример двухфакторного эксперимента1, где автор работы не применял ДА. В том случае, если автором приводятся лишь средние значения зависимой переменной, создайте данные сами (так, чтобы они соответствовали приведенным средним) и обработайте их в одной из статистических систем. Проанализируйте полученные результаты и подумайте, согласны ли вы с основными выводами автора.

1 Для этой цели стоит обратиться к любому номеру 'Психологического журнала' за 7090-е годы и найти там экспериментальную статью.


ГЛАВА 4
ДИСПЕРСИОННЫЙ
4.1. О ДА
АНАЛИЗ ДАННЫХ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ
СОБЕННОСТИ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ

В предыдущем разделе мы рассматривали примеры, когда в разных экспериментальных группах (клетках таблицы для ДА) были результаты измерений зависимой переменной, полученные от разных испытуемых. Строго говоря, мы имели дело с независимыми или несвязанными выборками. Однако нередко бывает, что используется экспериментальный план, при котором в различных сочетаниях уровней факторов участвовали одни и те же испытуемые. Например, в эксперименте по исследованию эффективности совместной деятельности варьировали уровень мотивации (фактор А: 3 уровня) и оценивали влияние проводимого тренинга общения до и после него (фактор В: 2 уровня). В подобных экспериментах, как правило, используют данные одной и той же группы испытуемых. Но в таком случае трудно предположить, что повторные данные независимы и не коррелируют друг с другом, поскольку самый успешный испытуемый покажет более высокие результаты при различных экспериментальных условиях, а неуспешный будет в среднем так же ниже остальных. Это означает, что мы нарушаем очень важное допущение ДА о независимости выборок. Для компенсации этого недостатка в ДА используют метод оценки и исключения влияния зависимости выборок, вызванного повторным использованием одних и тех же испытуемых в разных экспериментальных условиях. В англоязычной литературе этот вариант многофакторного ДА получил название Repeated-Measures Design, т.е. эксперименталь-


85

ный план с повторными измерениями. Вариант ДА с повторными измерениями имеет большие преимущества, поскольку использование одних и тех же испытуемых во всех группах позволяет уменьшить общую дисперсию данных за счет исключения компоненты межиндивидуальных различий из остаточной дисперсии, что, в свою очередь, позволяет получать более высокие оценки .-отношения и с большей легкостью отвергать нулевые гипотезы. В качестве иллюстрации эффекта взаимодействия выборок рассмотрим специально подготовленный пример с нарочито преувеличенными данными. Пусть проведен однофакторный эксперимент, в котором измерялось число правильных ответов и варьировались 3 уровня фактора А (см. табл. 28).
Таблица 28 Данные однофакторного эксперимента с использованием одной и той же группы испытуемых
Экспериментальные условия (уровни фактора) А1 А2 А3 21 43 71 106 120 128 232 292 305 305 312 338 664 767 842 Всего по испытуемому 136 356 832 956 2280

Испытуемый 1 2 3 4 Всего по условию

Как видно, суммы по столбцам (по условиям) отличаются незначительно, и эти вариации скорее всего носят случайный характер. Однако суммы по строкам, характеризующие работу каждого из 4 испытуемых, отличаются значительно и характеризуют индивидуальный уровень исполнения тестового задания. Испытуемый 1 имеет меньше всего правильных ответов, и это закономерно повторяется во всех экспериментальных условиях. Испытуемые 3 и 4 значительно более успешны, что также проявилось на всех уровнях. Таким образом, вариабельность внутри условий эксперимента


86

в основном является следствием индивидуальных различий между испытуемыми, а не следствием различий трех экспериментальных условий. Таким образом, если бы мы смогли исключить эти индивидуальные различия, мы смогли бы более точно оценить ошибку дисперсионной модели и уменьшить ее. Кроме того, индивидуальные различия, создающие такую высокую корреляцию между экспериментальными условиями, могут быть выделены в качестве особого фактора, характеризующего испытуемых. На практике в вычислительных алгоритмах ДА с повторными измерениями сумма квадратов, соответствующая межиндивидуальной вариации, вычисляется и вычитается из общей суммы квадратов до начала вычислений остальных сумм квадратов. Эта сумма квадратов получила название меж2 d BS . Индекс BS озиндивидуальной суммы квадратов начает between subjects, т.е. 'между испытуемыми'. Таким образом, в модели ДА с повторными измерениями мы обозначили еще один компонент общей дисперсии, обусловленный влиянием межиндивидуальных вариаций испытуемых.



4.2. С

ТРУКТУРНАЯ МОДЕЛЬ

ДА

С ПОВТОРНЫМИ

ИЗМЕРЕНИЯМИ

Линейная модель ДА, описанная выше (см. с.9), дополняется влиянием индивидуальных различий испытуемых: Xij = mобщ. + tj +pi + tpji +eij (38) где mобщ. общее среднее или свободный член уравнения, tj дополнительный компонент, соответствующий влиянию j-го фактора (т.е. насколько среднее j-го фактора отличается от среднего генеральной совокупности), pi компонент, связанный с влиянием индивидуальности i-го испытуемого, tpji дополнительный эффект взаимодействия этих двух компонентов, eij ошибка линейной модели, связанная с j-м фактором и i-м испытуемым.


87

4.3. СТАТИСТИЧЕСКИЕ ИСПОЛЬЗУЕМЫЕ В ДА

КРИТЕРИИ И ПРЕДПОЛОЖЕНИЯ, С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ

Как уже было описано выше, в моделях одномерного ДА, где исследуется только влияние межгрупповых факторов, для оценки факторного эффекта используется обычный .-критерий или, как его еще называют, одномерный .-тест. В ДА с повторными измерениями используются два подхода одномерный и многомерный. Одномерный подход (его еще называют моделью расщепленных делянок1 или смешанной моделью) рассматривает зависимые переменные как повторные измерения, проведенные на различных уровнях внутригруппового фактора. Предполагается, что каждое измерение, полученное на отдельном испытуемом (объекте измерения), должно быть выборкой из многомерного нормального распределения. Кроме того, следует отметить необходимость выполнения еще одного математического допущения, чтобы быть уверенным, что любое эмпирическое .-отношение соответствует стандартному (табличному) распределению .-отношения. Это допущение о так называемой составной симметрии (compound symmetry) ковариационной матрицы, образованной переменными, соответствующими уровням межгрупповых факторов. Таблица 29 позволит нам точнее понять, о чем идет речь. Если мы имеем один фактор с тремя уровнями (как в предыдущем примере), расчет коэффициентов ковариации между столбцами матрицы данных (см. табл. 29: всего 3?3 = 9 элементов) дает нам ковариационную матрицу. Выполнение этого допущения означает, что элементы матрицы, лежащие на основной диагонали, должны быть равны, и остальные элементы (лежащие вне основной диагонали) также должны быть одинаковы. Отметим также, что равенство диагональных элементов корреляционной матрицы (cov11 = cov22 = cov33 ) означает выполнение допущения о гомогенности дисперсий выборок.
1 Исторически так сложилось, что изначально ДА применялся для оценки различных экспериментальных эффектов в сельском хозяйстве. Отсюда и термин 'делянка', т.е. та часть экспериментального поля, где оценивается определенный факторный эффект. В психологии 'делянке', как правило, соответствует отдельная группа испытуемых, дифференцируемая от других по определенному признаку межгрупповому фактору.


88 Таблица 29 Ковариационная матрица для данных однофакторного эксперимента со связанными выборками

A1 A2 A3

A1 cov11 cov21 cov31

A2 cov12 cov22 cov32

A3 cov13 cov23 cov33

Это допущение о составной симметрии ковариационной матрицы является частью более общего допущения о форме дисперсионно-ковариационных матриц, образованных межгрупповыми факторами и зависимыми переменными (внутригрупповыми факторами). Предполагается, что дисперсионноковариационные матрицы, полученные по межгрупповым факторам одинаковы, а по зависимым переменным это единичная матрица. Только при выполнении таких допущений использование .-критерия становится надежным средством статистической оценки факторных эффектов и межфакторных взаимодействий в ДА с повторными измерениями. Для проверки последнего предположения обычно используется тест сферичности Моучли (Mauchly). Тем не менее, не стоит переоценивать значение использования данного теста, поскольку для малых выборок он не обладает большой мощностью, а для больших выборок даже очень небольшие отклонения могут оказаться статистически значимыми. Когда допущение о сферичности оказывается нарушенным, в процедуре ДА с повторными измерениями может вводиться специальная поправка, уменьшающая число степеней свободы числителя и знаменателя в .-отношении, и, следовательно, значимость .-критерия оценивается со скорректированными степенями свободы. В ряде статистических систем такая поправка обозначается как эпсилон-коррекция (epsilon ajustment). Многомерный подход также рассматривает зависимые переменные как повторные измерения, проведенные на различных уровнях внутригруппового фактора. Для статистической оценки факторного эффекта в этом подходе использует-


89

ся не .-критерий, а так называемые многомерные тесты (подробнее об этом см. в следующей главе, посвященной многомерному ДА). В этом подходе также предполагается, что измерения, полученные по каждому испытуемому, должны быть выборкой из многомерного нормального распределения. Кроме того, принимается допущение об идентичности дисперсионно-ковариационных матриц, образованных межгрупповыми факторами. Для проверки предположения об идентичности дисперсионно-ковариационных матриц в большинстве статистических систем обычно используется М-тест Бокса (Boxs M-test). Поскольку в ДА с повторными измерениями для оценки факторного эффекта используются как одномерный, так и многомерные критерии, правомерен вопрос: какой подход более предпочтителен? В том случае, если оба подхода дают сходные результаты, вопрос о выборе не так уж важен. Однако, в случае, когда один из подходов оценивает факторный эффект как значимый, а другой нет, поставленный выше вопрос весьма важен. Если для обоих подходов указанные выше допущения удовлетворяются, то в целом одномерный подход обладает большей мощностью по сравнению с многомерным. Это означает, что он с большей вероятностью обнаружит оцениваемый факторный эффект или взаимодействие факторов. Это преимущество особенно заметно на малых выборках. Вместе с тем, заметим, что многомерный подход в целом накладывает меньше ограничений на анализируемые данные.

4.4. ПРИМЕР

ОБРАБОТКИ ОДНОФАКТОРНОГО

ЭКСПЕРИМЕНТА С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ

Покажем, как делаются все вычисления по данным эксперимента из области психосоматики (см. Хауэлл, 1998). На группе из 9 испытуемых, страдающих мигренью, изучалось влияние тренинга релаксации на частоту проявления головных болей. Испытуемых просили регистрировать количество часов мигренеподобных приступов в течение 5 недель: 2 недели до тренинга (фоновые замеры) и 3 недели в ходе тренинга (воздействие).


90 Таблица 30 Данные о частоте головных болей
Фон 2 1 неделя неделя 21 22 20 19 17 15 25 30 30 27 19 27 26 16 17 18 26 24 201 N
total

Испытуемый 1 2 3 4 5 6 7 8 9 Всего по неделям В целом по эксперименту

3 неделя 8 10 5 13 13 8 5 8 14 84

Тренинг 4 неделя 6 4 4 12 8 7 2 1 8 52 s

5 неделя 6 4 5 17 6 4 5 5 9 61
2 total

Всего по испытуемым 63 57 46 97 84 65 54 49 81

198

= 45,

total = 596,

= 71.96

Сначала рассчитаем общую по всем испытуемым сумму квадратов:



d

2 total

=(N

total

2 - 1) stotal = 44 71.96 = 3166.24.

(39)

Затем межиндивидуальную сумму квадратов:



d

2 IWG

=

k
n

(

Xi)

2

( -


i =1

N

Xi)

2

j =1

N

=
(40)

632 + 572 + ... + 812 (596) 2 = - = 5 45 = 8380.40 - 788.48 = 486.71,

где n количество испытуемых в каждой группе, k число недель наблюдения (групп), j знак суммирования средних по испытуемым, а i индекс суммирования значений всех наблюдений в отдельности. Индекс IWG означает individual differences within group, или межиндивидуальные различия внутри одной группы.


91

Далее вычислим межгрупповую (или факторную) сумму квадратов:


=

d

2 BG

=

(X n
k m =1

i

)

2

( -


i =1

N

Xi)

2

N

=
(41)

2012 + 1982 + ... + 612 (596)2 - = 45 9 = 10342,89 - 788.48 = 2449.20,

где n число испытуемых в группе, m знак суммирования средних по k группам. И наконец, внутригрупповую (или остаточную) сумму квадратов вычисляем как разность между общей факторной, межиндивидуальной и межгрупповой суммами квадратов:



d

2 WG

=

= 3166.24 - 486.71 - 2449.20 = 230.33



d

2 total

-



d

2 IWG

-



d

2 BG

=

.

(42)

Таким образом, при оценке остаточной суммы квадратов мы исключили влияние межиндивидуальной вариативности и тем самым ее уменьшили. Результаты проведенного ДА показывают статистическую значимость контролируемого фактора неделя эксперимента, что вполне соответствует простому сравнению суммарных значений времени головных болей, данных в последней строке таблицы 30. Поэтому у нас есть все основания думать, что проведенный тренинг релаксации был успешным. Дополнительный статистический анализ парных сравнений средних по группам будет дан ниже при проведении ДА в системе SPSS. Сведем все дальнейшие вычисления в таблицу результатов ДА (см. табл. 31). Эффективность использования модели ДА с повторными измерениями можно продемонстрировать, проведя однофакторный ДА при условии, что в исследовании участвовали 3 различные группы испытуемых. В этом случае величина .-отношения для исследуемого фактора будет равна 34.15.


92 Таблица 31 Результаты однофакторного ДА с повторными измерениями
Источник вариации Межиндивидуальная Факторная (межгрупповая) Остаточная (внутригрупповая) Общая Степени свободы 8 4 32 44



d

2

^ s

2

F

P

486.71 2449.20 230.40 3166.24 612.30 7.20 85.04 <0.01

Сравнив эту величину с аналогичной из таблицы 31, мы увидим, что она более чем вдвое меньше. Таким образом, мы получили очень большой выигрыш при оценке факторного эффекта. Стоит обратить внимание на отсутствие в таблице результатов оценки взаимодействия межиндивидуального и факторного источников вариации, как следовало бы из описанной выше структурной модели ДА с повторными измерениями. Фактически в том случае, когда имеется лишь одно измерение в клетке дисперсионной таблицы (см. табл. 30, где на пересечении строки 'испытуемый' со столбцом 'неделя' приходится всего одно число), сумма квадратов взаимодействия совпадает с суммой квадратов остатков. В данном варианте экспериментального плана эти два источника вариации разделить невозможно. Чтобы читатель лучше ориентировался в зарубежных статистических системах и их описаниях, определим, что фактор, контролируемый на одной и той же выборке испытуемых, в англоязычной литературе принято называть WithinSubjects .actor или Within-Subjects Variable. Мы называем его внутригрупповым фактором, подчеркивая тем самым, что его спецификой является интраиндивидуальная вариабельность одной и той же группы испытуемых (subjects), наблюдаемых повторно, т.е. при различных уровнях внутригруппового фактора. При оценке влияния таких факторов учитываются индивидуальные различия. В отличие от него фактор, заданный на выборках разных испытуемых, называют Between-Subjects


93

.actor или Between-Subjects Variable. Мы называем его межгрупповым фактором, подчеркивая, что его спецификой является интериндивидуальная вариабельность, наблюдаемая в группах, состоящих из различных испытуемых, в соответствии с заданными уровнями фактора. Эти факторы разделяют выборку испытуемых на отдельные группы. При оценке влияния межгрупповых факторов индивидуальные различия не учитываются. Если мы в последнем примере для наглядной проверки сделанного предположения о симметричности ковариационной матрицы визуально оценим ее, то увидим, что это предположение резонно принять, поскольку разброс сравниваемых коэффициентов ковариации не столь уж велик: для диагональных элементов он составил от 11.5 до 28.5, а для недиагональных 7.3316.38 (см. табл. 32).
Таблица 32 Ковариационная матрица, рассчитанная по экспериментальным данным
Неделя 1 21.00 11.75 9.25 7.83 7.33 Неделя 2 11.75 28.50 13.75 16.38 13.38 Неделя 3 9.25 13.38 11.50 8.58 8.21 Неделя 4 7.83 16.38 8.58 11.69 10.82 Неделя 5 7.33 13.38 8.21 10.82 16.95

Не Не Не Не Не

де де де де де

л л л л л

я я я я я

1 2 3 4 5

Тест Моучли в этом примере не обнаружил нарушения сферичности.

4.5. ДВУХФАКТОРНЫЙ ДА

С ВНУТРИГРУППОВЫМИ

И МЕЖГРУППОВЫМИ ФАКТОРАМИ

Рассмотренный выше пример представляет собой простой однофакторный эксперимент. В реальной практике экспериментальных исследований чаще встречаются более сложные экспериментальные планы, когда контролируются и внутригрупповые и межгрупповые факторы. Такие экспериментальные планы иногда называют смешанными.


94

Пример 1: один фактор внутригрупповой, другой межгрупповой1. Канадский исследователь Д.А.Кинг (1986) проводил эксперимент по изучению привыкания крыс к воздействию наркотиков. Использовались три различные группы по 8 животных (фактор А 'группа': 3 уровня) контрольная и две экспериментальных. Поскольку использованный наркотик оказывает быстрое действие, особенности двигательного поведения животных в каждой группе оценивались в течение часа после его приема по 6 пятиминутным интервалам наблюдения (фактор В 'интервал': 6 уровней). Таким образом, фактор А группа испытуемых животных является межгрупповым фактором, поскольку он контролируется на различных группах испытуемых или на независимых выборках. Фактор В внутригрупповой фактор, поскольку он контролируется внутри одной и той же группы крыс по отдельности. Соотношение различных источников вариативности данных представлено на рис. 15 в виде схемы.
Общая дисперсия
М е жг ру ппо вая в а ри ати в н о ст ь Вн ут р и г р уп по в а я @95 в а ри ати в н о ст ь

@

*5



Фактор А 'группа'

a

Индивидуальные различия в группах

Фактор В a 'интервал'

Взаимодействие факторов А и В Взаимодействие фактора В и индивидуальных различий в группах

Рис. 15. Различные составляющие общей дисперсии в эксперименте со смешанным планом
1

С некоторыми изменениями пример заимствован из книги Д.Хауэлла (1998).


95

Рассматривая вклад межгрупповой вариативности между 3 группами испытуемых (основной эффект фактора А) и 2) индивидуальные различия внутри каждой группы из 8 испытуемых. Первая компонента обусловлена включением в план эксперимента независимой переменной 'группа испытуемых' (одна контрольная и две экспериментальные), что определяет такой источник вариативности как различия между группами испытуемых. Однако это не единственный источник различия между испытуемыми. Кроме того, в каждой отдельной группе есть 8 животных со своими индивидуальными различиями. Фактор А в данном экспериментальном плане называют, таким образом, межгрупповым фактором. В принципе, если бы для каждой группы испытуемых усреднить данные по всем 6 интервалам наблюдения, то мы бы смогли провести обычный однофакторный ДА и оценить основной эффект фактора 'группа'. Проведя такой отдельный анализ, можно оценить также и соответствующую остаточную сумму квадратов ( видуальных различий. 2 dWS мы выделяВо внутригрупповой вариативности ем три компонента (см. рис. 15): 1) различия между 6 последовательными временными интервалами, в рамках которых производилась оценка двигательной активности животных (т.е. основной эффект фактора В); 2) взаимодействие фактора В и фактора А и 3) взаимодействие фактора В с индивидуальными различиями испытуемых внутри групп. Первый компонент обусловлен введением в эксперимент 6 интервалов наблюдения за одной и той же группой крыс, поэтому фактор В и называют внутригрупповым. Он также зависит от индивидуальных различий внутри группы испытуемых. Поскольку фактор В внутригрупповой, то и его взаимодействие с фактором А (второй компонент) также является внутригрупповым эффектом. Третий компонент внутригрупповой вариативности взаимодействие фактора В и индивидуальных



d

2 BS

, мы выделяем в ней два компонента: 1) различия



d

2 BG

), не зависимую от влияния (эффекта) инди-




96

различий внутри группы иногда называют остаточным, поскольку, как мы отмечали выше, он фактически соответствует остаточной сумме квадратов1. В двухфакторном ДА со смешанным планом суммы квадратов связаны очень простыми соотношениями; их стоит (наряду с соответствующим рис. 15) внимательно изучить, чтобы более четко усвоить специфику соотношения межгрупповых и внутригрупповых факторов и лучше ориентироваться в стандартных распечатках большинства статистических систем:

Аналогичными соотношениями связаны и соответствующие суммам квадратов величины степени свободы. Пример 2: два межгрупповых фактора и один внутригрупповой 2. В исследовании Лауренса и др. (1995) изучалась эффективность нового вида обучающей программы (тренинга) по предупреждению риска венерических заболеваний среди чернокожих американцев. Использовались 2 типа обучающих тренингов: традиционный, двухчасовой и новый, восьмичасовой (фактор А 'тренинг': 2 уровня). Участвовали испытуемые обоих полов мужчины и женщины (фактор В 'пол': 2 уровня). Зависимой переменной была частота использования презервативов в течение 4 периодов проведения исследования: до тренинга, сразу после него, спустя 6 и 12 месяцев (фактор С 'время': 4 уровня). В исследовании приняли участие 4 группы испытуемых по 10 человек в каждой (гр. 1 гр.4). Таким образом, обрабатывались данные трехфакторного эксперимента 2?2?4. Данный экспериментальный план
1 Фактически сумма квадратов взаимодействия фактора В и индивидуальных различий рассчитывается как сумма сумм квадратов отдельно по каждой группе. Поэтому этот компонент логически эквивалентен остаточной сумме квадратов, как мы ее рассматривали в предыдущих разделах. 2 Пример с незначительными изменениями заимствован у Д.Хауэлла (1998).



d

2 total 2 BS

d d

2 IWG

d = d = d
=

2 BS

+



2 dWS ,

(43)
2 IWG

2 Фактор А

+

2 Фактор B

d + d

,, +

(44)

2 Фактор AЧB



2 dФактор

B ЧIWG

.

(45)


97

представим в виде таблицы и разберем, какие факторы были межгрупповыми, а какой внутригрупповым (см. табл. 33).
Таблица 33 Схема трехфакторного эксперимента с ДА с повторными измерениями: 2?2?4
Традиционное обучение До Мужчины Женщины гр. 1 гр. 3 После гр. 1 гр. 3 6 мес. гр. 1 гр. 3 12 мес. гр. 1 гр. 3 Тренинг поведенческих навыков До гр. 2 гр. 4 После гр. 2 гр. 4 6 мес. гр. 2 гр. 4 12 мес. гр. 2 гр.4

Поскольку фактор 'время' контролировался внутри каждой из четырех групп испытуемых и, тем самым, по каждой группе были 4 раза собраны повторные измерения, он является внутригрупповым. Таким образом, источником внутригрупповой вариации данных будут: 1) основной эффект фактора 'время'; 2) взаимодействие основного эффекта фактора 'время' и эффекта индивидуальных различий испытуемых в группе; 3) взаимодействие фактора 'время' и фактора 'тренинг'; 4) взаимодействие фактора 'время' и фактора 'пол'; 5) тройное взаимодействие факторов 'время' ? 'тренинг' ? 'пол'. Факторы 'группа' и 'пол' межгрупповые, поскольку их вариации наблюдаются на разных независимых выборках (группах) испытуемых. Источниками межгрупповой вариации являются: 1) основной эффект фактора 'тренинг'; 2) основной эффект фактора 'пол'; 3) взаимодействие факторов 'тренинг' ? 'пол'; 4) эффект индивидуальных различий испытуемых. Пример 3: два внутригрупповых фактора и один межгрупповой. С заикающимися детьми проводилась психотерапевтическая работа с использованием двух альтернативных методов психотерапии (фактор 'психотерапия': 2 уровня). Психотерапевтическая работа сопровождалась медикаментозным лечением, включавшим 3 различные дозы приема миорелаксирующего препарата (фактор 'доза': 3 уровня). Качество речи


98

ребенка оценивалось в три временных периода исследования: до начала лечения, в середине лечения, в конце лечения (фактор 'время': 3 уровня). Схема эксперимента представлена в таблице 34.
Таблица 34 Схема трехфакторного эксперимента со связанными выборками: 3?2?3
Психотерапия 1 Доза 1 До лечения В середине В конце гр . 1 гр. 1 гр. 1 Доза 2 гр. 1 гр . 1 гр . 1 Доза 3 гр . 1 гр. 1 гр. 1 Доза 1 гр. 2 гр . 2 гр . 2 Психотерапия 2 Доза 2 гр . 2 гр. 2 гр. 2 Доза 3 гр. 2 гр . 2 гр . 2

Факторы 'психотерапия' и 'доза' внутригрупповые, поскольку они контролируются на одной и той же группе испытуемых. Фактор 'время' межгрупповой, т.к. его эффект мы наблюдаем на двух независимых группах испытуемых. Межгрупповая вариация состоит из двух компонентов: 1) основного эффекта фактора 'время' и 2) эффекта индивидуальных различий испытуемых в каждой группе. Внутригрупповая вариация более сложна и складывается из следующих составляющих: 1) основной эффект фактора 'психотерапия'; 2) взаимодействие факторов 'психотерапия'?'время'; 3) взаимодействие основного эффекта фактора 'психотерапия' и эффекта индивидуальных различий испытуемых в группе; 4) основной эффект фактора 'доза'; 5) взаимодействие факторов 'доза'?'время'; 6) взаимодействие основного эффекта фактора 'доза' и эффекта индивидуальных различий испытуемых в группе; 7) взаимодействие факторов 'психотерапия'?'доза'; 8) тройное взаимодействие факторов 'психотерапия'?'доза'?'время'. Кроме того, в силу специфики взаимодействия двух внутригрупповых факторов появляется еще один источник вариации взаимодействие взаимодействия этих факторов с эффектом индивидуальных различий испытуемых: ('психотерапия'?'доза')?'индивидуальные различия'. Этот источник вариации часто называ-


99

ют модельным, поскольку, хотя он и оценивается, но какого-либо содержательного значения в анализе данных не играет. Пример 4: только внутригрупповые факторы. Такой экспериментальный план, когда все факторы внутригрупповые, очень редко обсуждается в статистической литературе, хотя в психологических исследованиях встречается довольно часто. Например, так бывает при исследовании сенсорно-перцептивных процессов , когда необходимы уникальные испытуемые, найти которых чрезвычайно сложно, а поэтому, будучи однажды найденными, они долгое время участвуют в опытах1. В такого типа экспериментальном плане, когда в каждой клетке таблицы представлен всего один испытуемый, фактически каждая независимая переменная это внутригрупповой фактор. Линейную двухфакторную модель, лежащую в основе такого типа ДА, можно представить следующим образом: Xij = mобщ. + ai + bj + abij+ pn+ apin+ bpjn +abpijn + eijn (46) где: mобщ. общее среднее, ai дополнительный компонент, соответствующий влиянию i-го фактора, bj дополнительный компонент, соответствующий влиянию j-го фактора, abij компонент взаимодействия двух факторов, pn компонент, связанный с влиянием индивидуальности испытуемого, apin компонент, обусловленный взаимодействием фактора a и эффектом индивидуальности испытуемого, bpjn компонент, обусловленный взаимодействием фактора b и эффектом индивидуальности испытуемого, abpijn компонент, обусловленный тройным взаимодействием: факторов a, b и влиянием индивидуальности испытуемого, eijn ошибка линейной модели, связанная с i-м и j-м факторами и n-м испытуемым. Хотя мы внесли в структурную модель составляющую, связанную со взаимодействием индивидуальности испытуе1 Это могут быть испытуемые с уникальными сенсорными способностями, или, наоборот, с редкими дефектами зрения. Нередко исследования проводят в течение многих лет на одних и тех же парах близнецов.


100

мого и факторов, ее вклад, как правило, бывает очень незначителен и фактически плохо интерпретируем. Рассмотрим в качестве примера вымышленное психогенетическое исследование, в котором в качестве испытуемых участвуют тройни (S1, S2 и S3 ). В эксперименте оценивался индекс активации головного мозга по спектру электроэнцефалограммы (ЭЭГ). Первый контролируемый фактор условие регистрации ЭЭГ: глаза открыты, глаза закрыты, сенсорная стимуляция (фактор 'ЭЭГ-активация': 3 уровня). Второй фактор место регистрирующего электрода на поверхности головы: лоб .z, центр Сz, темя Рz, затылок Oz1 (фактор 'зона': 4 уровня). Третий фактор возраст испытуемых: 1 год, 2 года, 3 года (фактор 'возраст': 3 уровня). Схема эксперимента представлена для наглядности в таблице 35.
Таблица 35 Схема эксперимента с тремя внутригрупповыми факторами: 3?4?3
Возраст Глаза открыты Fz S S S S 2 года S S S S S
1 2 3 1 2 3 1 2 3

Глаза закрыты Oz S1 S2 S3 S1 S2 S3 S1 S2 S3 Fz S S S S S S S S S
1 2 3 1 2 3 1 2 3

Сенс. cтимуляция Oz S1 S2 S3 S1 S2 S3 S1 S2 S3 Fz S S S S S S S S S
1 2 3 1 2 3 1 2 3

Cz S1 S2 S3 S1 S2 S3 S1 S2 S3

Pz S S S S S S S S S
1 2 3 1 2 3 1 2 3

Cz S1 S2 S3 S1 S2 S3 S1 S2 S3

Pz S S S S S S S S S
1 2 3 1 2 3 1 2 3

Cz S1 S2 S3 S1 S2 S3 S1 S2 S3

Pz S S S S S S S S S
1 2 3 1 2 3 1 2 3

Oz S1 S2 S3 S1 S2 S3 S1 S2 S3

1 год

3 года

Таким образом, трое одних и тех же испытуемых включены в каждую клетку таблицы, и, следовательно, они являются источником данных, полученных во всех 36 условиях эксперимента (3?4?3). Из этого следует, что все 3 фактора внутригрупповые.
1 .z, Cz, Pz и Oz стандартные обозначения мест расположения электродов на скальпе.


101

Рассмотрим составные части внутригрупповой вариации данных этого эксперимента: 1) основные эффекты всех трех факторов; 2) эффект индивидуальных различий испытуемых; 3) эффекты их попарного взаимодействия; 4 ) эффект тройного взаимодействия факторов; 5) эффекты взаимодействия индивидуальных различий испытуемых с парными взаимодействиями факторов; 6) эффект взаимодействия индивидуальных различий испытуемых с тройным взаимодействием факторов. Всего 15 составляющих. Как правило, для содержательной интерпретации интерес представляют лишь основные эффекты факторов и их взаимодействие.

КОНТРОЛЬНЫЕ

ВОПРОСЫ

1. Что означают понятия 'независимые' и 'связанные выборки' применительно к экспериментальному плану? 2. Покажите на примере, почему связанность выборок предполагает корреляцию между ними. 3. Какие преимущества имеет вариант ДА с повторными измерениями? 4. Что означает термин Repeated-Measures Design? 5. Каким образом в ДА с повторными измерениями компенсируется наличие зависимых (связанных) выборок? 6. Какой компонент общей дисперсии обозначается как 7. Напишите формулу структурной модели двухфакторного ДА с повторными измерениями и дайте ей пояснение. 8. Какое дополнительное математическое допущение принимается в ДА с повторными измерениями? 9. Что означают термины Within-Subjects .actor и Between-Subjects .actor? 10. Какие составляющие входят во внутригрупповую и межгрупповую вариативность?



d

2 BS

?


102

4.6. ОБРАБОТКА

ДАННЫХ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ

В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

STADIA 6.0

В системе Stadia имеется несколько вариантов обработки данных с повторными измерениями. Основой для программной реализации используемых алгоритмов ДА автору Stadia А.П.Кулаичеву послужила книга А.Афифи и С.Эйзена 'Статистический анализ. Подход с использованием ЭВМ' (1982). К сожалению, как отмечают и сами авторы данной книги (с.266), в предложенных алгоритмах не учитывается факт зависимости повторных измерений. Это означает, что при оценке остаточной суммы квадратов мы не исключили влияние межиндивидуальной вариативности и тем самым ее скорректировали. Поэтому предложенные в системе Stadia методы обработки целесообразно использовать при обработке экспериментальных данных в том случае, когда в процессе исследования в какой-то степени обеспечена независимость выборок, полученных при повторных измерениях. Например, такую зависимость можно уменьшить, делая большие временные интервалы между последовательными исследованиями. Таким образом, имеющиеся в статистической системе Stadia алгоритмы ДА с повторными измерениями имеют ограниченное использование1. Четыре различных алгоритма ДА с повторными измерениями, реализованные в Stadia, соответствуют четырем различным типам экспериментальных планов, и поэтому при использовании данной статистической системы следует четко ориентироваться на описание этих моделей, данное в книге А.Афифи и С.Эйзена (с.264266). Кратко опишем, как выполнить обработку данных для этих моделей. В меню статистических методов нужно выбрать подменю 'Дисперсионный анализ', а в нем вариант 'Двухфакторный'. В появившемся окне даны 4 варианта моделей с повторными измерениями:
1 В настоящее время А.П.Кулаичевым уже внесены необходимые изменения в алгоритм ДА.


103

1. Модель с фиксированными эффектами означает, что должны быть заданы 2 фактора с фиксированными эффектами. 2. Модель со случайными эффектами означает, что должны быть заданы 2 фактора со случайными эффектами. 3. Модель с рандомизированными блоками предполагает, что первый (внутригрупповой) фактор является фиксированным, а второй (межгрупповой) случайным. Например, исследуется различие двух методов психотерапии (первый фактор) на группе из 5 испытуемых, причем каждый метод применяется к каждому испытуемому; в качестве измеряемой переменной используется какой-нибудь показатель самооценки. В данном случае блоком является испытуемый. 4. Модель с группировкой предполагает, что один из факторов главный (группирующий), а второй подчиненный (группируемый). Например, одна случайная выборка испытуемых подвергается одному методу психотерапии, а другая случайная выборка другому. При этом с каждым испытуемым проводится по 5 повторных измерений. В данном случае метод психотерапии является группирующим фактором, по которому сгруппированы испытуемые (второй фактор). Первый фактор фиксированный, второй случайный. При обработке данных указанных выше экспериментов исходные данные вводятся в Редактор данных особым образом. Они представляют собой псевдоматрицу (столбцы не должны быть обязательно одинаковой длины), в которой переменные (столбцы) должны соответствовать комбинации различных уровней исследуемых факторов, а строки повторным измерениям. Причем столбцы должны следовать в порядке изменения уровней первого фактора: все уровни первого фактора для первого уровня второго фактора, все уровни первого фактора для второго уровня второго фактора и т.д. Сколько было измерено повторных сочетаний уровней двух факторов, столько и строк будет содержать матрица данных. Результаты дисперсионного анализа включают стандартную таблицу, описанную выше в главе 3 (см. с.70).


104

4.7. ОБРАБОТКА

ДАННЫХ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ

В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

SPSS 8.01

Как было сказано выше, в англоязычной литературе процедура ДА с повторными измерениями получила название Repeated-Measures (повторные измерения). В системе SPSS такая процедура имеется. В отличие от системы Stadia, в SPSS данный тип дисперсионного анализа организован как универсальная процедура, не зависящая от конкретного вида экспериментального плана, что позволяет психологу производить обработку данных широкого круга экспериментов, в которых могут быть выделены внутригрупповые факторы. Вместе с тем такая универсальность накладывает известные трудности, обусловленные необходимостью четкого выделения в проведенном исследовании внутригрупповых и межгрупповых факторов, ковариат и даже сознательного выбора нюансов модели ДА. Здесь, как и в других сложных статистических процедурах, за широту и универсальность приходится 'платить' необходимостью знать и понимать различные варианты и тонкости ДА с повторными измерениями. По сравнению со всеми предыдущими примерами, форма ввода данных в электронную таблицу для обработки с помощью данной процедуры значительно отличается. Данные заносятся следующим образом. Сначала вводят переменные, соответствующие уровням внутригруппового(ых) фактора(ов). Затем вводятся переменные, содержащие уровни межгруппового(ых) фактора(ов). Рассмотрим, как обрабатываются данные двух примеров, описанных в данном разделе. Первый пример (см. табл. 30) представляет собой однофакторный план с повторными измерениями: на группе из 9 испытуемых, страдающих мигренью, в течение 5 недель изучалось влияние тренинга релаксации на частоту проявления головных болей. Внутригрупповым фактором в данном примере является время эксперимента: 5 уровней 5 недель. Данные в Редактор Данных (SPSS Data


105

Editor) вводятся так, как это показано ниже во фрагменте электронной таблицы SPSS, т.е. как последовательность столбцов, соответствующих пяти уровням одного фактора:
week1 1 2 3 4 5 6 7 8 9 10 11 21 20 17 25 30 19 26 17 26 . . week2 22 19 15 30 27 27 16 18 24 . . week3 8 10 5 13 13 8 5 8 14 . . week4 6 4 4 12 8 7 2 1 8 . . week5 6 4 5 17 6 4 5 5 9 . .

Таким образом, девяти строкам соответствуют 9 испытуемых, пяти столбцам 5 уровней фактора. После окончания ввода данных в меню статистических методов Статистика (Statistics) следует выбрать группу методов Общая линейная модель (General Linear Model), а в ней нужную нам процедуру ОЛМ Повторные измерения (GLM Repeated-Measures). Далее необходимо определить, с какими внутригрупповыми факторами (Within-Subject) мы будем работать, для чего в появившемся окне следует указать имя фактора. Можно задать любое имя это никак не связано с именами введенных переменных. Определим имя нашего фактора: Имя внутригруппового фактора (WithinSubjects .actor Name): неделя. Далее следует указать число уровней этого фактора. Число уровней в нашем примере (Number of Levels) 5. Нажатием на кнопку Добавить (Add) мы вводим один внутригрупповой фактор в список факторов. Если для оценки изучаемого фактора в эксперименте использовалось несколько переменных (т.е. измерения про-


106

водились сразу по нескольким параметрам1), то можно указать сразу несколько переменных. Для этого следует нажать на кнопку Измерения>> (Measure>>), указать для каждой переменной (экспериментальной меры) подходящее Имя измерения (Measure Name:), а затем нажать на кнопку Добавить (Add). Поскольку в качестве единственной зависимой переменной в нашем примере измерено количество часов головной боли, дадим ей название 'время'. Окончание этапа определения факторов завершается нажатием на кнопку Определить (Define). В новом появившемся окне необходимо указать, какие переменные соответствуют уровням заданного фактора. Для этого выделяем щелчком мыши все 5 нужных нам переменных, и, нажав на кнопку со стрелочкой, переносим их в окно направо. Поскольку у нас нет ни межгрупповых факторов (Between-Subjects .actors), ни переменныхковариат (Covariates), то можно сразу запустить процедуру ДА. Однако, в данной процедуре имеется несколько дополнительных возможностей, с которыми, на наш взгляд, полезно ознакомиться. Пользователь может выбрать одну из моделей обработки данных Модель... (Model...). Задание варианта Полный факторный (.ull .actorial) означает, что рассчитываются все основные факторные эффекты (как внутригрупповых, так и межгрупповых факторов) и их взаимодействия. Вариант Настраиваемая (Custom) означает, что можно включить в модель только межгрупповые (Between-Subjects) и/или внутригрупповые (Within-Subjects) факторы, а также ограничить вычисления оценкой основных факторных эффектов или их взаимодействий. Изменять способ расчета Сумм квадратов (Sum of Squares:) по сравнению с предложенным по умолчанию (Type III) не очень опытным пользователям вряд ли стоит.
1 Например, в нашем примере головная боль могла оцениваться не только по своей продолжительности, но также и по характеру проявления, локализации и т.д. Такие экспериментальные планы, где измерялась более чем одна независимая переменная, называют планами с многомерными повторными измерениями (Doubly Multivariate Repeated Measures Designs).


107

Если пользователь хочет оценить соотношение между уровнями фактора, то следует выбрать опцию Контрасты (Contrasts...), а в ней один из 6 методов оценки контрастов по умолчанию контрасты не оцениваются. При необходимости в результаты могут быть включены графики соотношения средних значений измеряемой переменной для различных уровней различных факторов. Для этого следует воспользоваться опцией Графики (Plots...) Методы множественных парных сравнений реализуются в опции Апостериори (Post Hoc Tests) только для межгрупповых факторов, поэтому в нашем случае они не доступны. Для того, чтобы рассчитанные параметры модели сохранить в матрице данных, предусмотрена возможность их записи как новых переменных Сохранить (Save...). Эти новые переменные могут быть в дальнейшем проанализированы на предмет соответствия модели исходным данным. В опции Параметры (Options...) можно заказать для выдачи в результаты анализа много дополнительных показателей, характеризующих данные и модель ДА. Как и в предыдущих случаях, для начала выполнения данной процедуры ДА требуется нажать кнопку OK. В окне результатов распечатывается довольно обширная статистическая информация, касающаяся не только оценки одного факторного эффекта, но также и описательной статистики, результатов теста на сферичность, проверки гомогенности дисперсий и т.д. Мы приведем здесь лишь основные результаты (см. табл. 36): дескриптивные статистики (табл. 36, А) и оценка эффекта внутригруппового фактора по многомерным критериям (табл. 36, Б) и .-критерию (табл. 36, Г), результаты теста на сферичность (табл. 36, В). Ограничимся лишь короткими комментариями полученных результатов. Как видно из распечатки результатов ДА, и многомерные тесты, и оценка по .-критерию исследуемого факторного эффекта (неделя наблюдения за головными болями) показали его высокую значимость. Это означает, что средние оценки времени головных болей, зарегистрированные испытуемыми после участия в тренинге релаксации, были различны. Обратив внимание на таблицу с результата-


108 Таблица 36 Результаты однофакторного ДА данных со связанными выборками в системе SPSS 8.01
А

Общая Линейная Модель
Within-Su bject Factors Изм ерение : ЧАС Ы Зависимая НЕДЕЛЯ перем енная 1 НЕДЕЛЯ1 2 НЕДЕЛЯ2 3 НЕДЕЛЯ3 4 НЕДЕЛЯ4 5 НЕДЕЛЯ5

Descriptive Statistics Сред нее 22.33 22.00 9.33 5.78 6.78 Стд . откл он е н ие 4.58 5.34 3.39 3.42 4.1 2 N 9 9 9 9 9

НЕ НЕ НЕ НЕ НЕ

ДЕЛ ДЕЛ ДЕЛ ДЕЛ ДЕЛ

Я Я Я Я Я

1 2 3 4 5

Б
Multivariate Tests Э ффе кт НЕДЕЛЯ Значение .986 .01 4 69.11 3 69.11 3 . 86.391 86.391 86.391 86.391 Ст. с в. гип оте зы 4.000 4.000 4.000 4.000 Ст.св . ошиб ки 5.000 5.000 5.000 5.000 Зна ч. .000 .000 .000 .000 Эта в кв адрате .986 .986 .986 .986

След П илла я Лямб да Уилкса След Х отеллинга Н аибольший кор е нь Роя

В
Mauchly`s Test of Sphericity Изм ерение: ЧА СЫ

Внутриобъектный эффект
НЕДЕЛЯ

Прибл. W М оу чли хи-квадрат

Эпсилон
ст.св. Знач. Гринхауз -Гайссер Юнх-Фельдт

Ограни ченный сни з у

.282 8.114 9 .537 .684 1.000 Проверка нулевой гипотезы о том, что ковариационная матрица ошибок ортонормированного преобразования зависимых переменных пропорциональна единичной матрице.
T ests o f W ith in-Su b ject E ffe ct

.250

Г
Из мерение: ЧАСЫ

Ис точ ни к
НЕ ДЕ ЛЯ

Ошибка (Н ЕДЕЛЯ)

Пр едп ола гая сфе ри ч ность Гри нхауз -Гай ссер Ю нх-Фе льдт Ограниченный с низу Пр едп ола гая сфе ри ч ность Гри нхауз -Гай ссер Ю нх-Фе льдт Ограниченный с низу

Су мма квадр атов ти п а III 24 49.20 0 24 49.20 0 24 49.20 0 24 49.20 0 23 0.4 00 23 0.4 00 23 0.4 00 23 0.4 00

ст.св. 4 2.7 38 4.0 00 1.0 00 32 21 .90 3 32 .00 0 8.0 00

Ср едни й квадр ат 61 2.3 00 894.5 77 61 2.3 00 24 49.20 0 7.2 00 10 .51 9 7.2 00 28.80 0

. 85 .04 2 85 .04 2 85 .04 2 85 .04 2

Зна ч. .00 0 .00 0 .00 0 .00 0

Эта в квадр ате .91 4 .91 4 .91 4 .91 4

ми оценки средних по неделям (см. табл. 36, А дескриптивные статистики), можно сделать вывод о том, что интенсивность головных болей после тренинга в целом по группе испытуемых снизилась. Использование как многомерных, так и одномерного тестов было оправдано, поскольку тест сферичности Моучли показал (см. табл. 36, В), что у нас нет


109

достаточных оснований отвергать принятие этого предположения (р = 0.537). Отметим, что в русской версии SPSS в качестве русских аналогов соответствующих английских терминов BetweenSubjects .actor и Within-Subjects .actor использованы, на наш взгляд, не совсем удачные варианты перевода внутриобъектные и межобъектные факторы (эффекты). Более того, в самой процедуре ОЛМ Повторные измерения при определении этих факторов и в итоговых распечатках допущены технические ошибки, связанные с неправильным называнием факторов и переменных. Поэтому мы советуем читателю работать с англоязычной версией SPSS или пользоваться нашим описанием данной процедуры, ориентируясь на английские аналоги русских терминов, данные в скобках. В следующем примере работы с SPSS обработаем данные эксперимента, в котором изучалась эффективность нового вида обучающей программы (тренинга) по предупреждению риска венерических заболеваний среди чернокожих американцев (см. с.96). Напомним, что экспериментальный план был трехфакторным: два межгрупповых фактора и один внутригрупповой. В качестве возможного варианта работы с SPSS покажем читателю, как пользоваться англоязычной версией этой системы. Как и в предыдущем примере, сначала вводятся данные в соответствии с внутригрупповым фактором Time (время исследования). Поскольку наблюдение за испытуемыми велось в 4 временных периода, то в первые 4 переменные (pretest, posttest, fu6, fu12) последовательно заносим соответствующие данные. Каждый столбец-переменная включает 40 наблюдений: (10 мужчин + 10 женщин) ? 2 вида тренинга. В пятую переменную (gender) вносим коды пола испытуемых: 1 мужчины, 2 женщины. В шестую переменную (training) заносим данные о виде тренинга, в котором участвовали испытуемые: 1 традиционное обучение, 2 тренинг поведенческих навыков. После ввода данных и проверки его правильности переходим в меню статистических методов (Statistics), где


110

training

Рис. 16. Ввод данных в электронную таблицу SPSS

выбираем General Linear Model (Общая линейная модель), а ней процедуру Repeated-Measures (Модель с повторными измерениями). Далее определяем внутригрупповой (WithinSubject) фактор, для чего в появившемся окне указываем его имя time (время) и число уровней фактора: Number of Levels: 4. Нажимаем на кнопку Add (добавить) и вводим наш один внутригрупповой фактор в список факторов. Далее указываем название измеряемого параметра независимой переменной, для чего, нажав на кнопку Measure>>(мера, параметр), пишем имя (Measure Name:) freq (сокращение от слова частота) и вносим его в список, нажимая на кнопку Add. Заканчиваем этап определения факторов нажатием на кнопку Define. В новом появившемся окне указываем, какие переменные соответствуют уровням заданного фактора: последовательно выбираем переменные pretest, posttest, fu6, fu12 и переносим их в правое окно. Поскольку у нас имеются два межгрупповых фактора (Between-Subjects .actors), указываем, каким переменным они соответствуют: gender и trening, и переносим их в окно


111 Таблица 37 Результаты ДА с одним внутригрупповым и двумя межгрупповыми факторами в системе SPSS 8.0

General Linear Model
Within-Subjects Factors Measure: FREQ TIME 1 2 3 4 Dependent Variable PRETEST POSTTEST FU6 FU12
Between-Subjects Factors

Box's Test of Equality of Covariance Matrices Box's M F df1 df2 Sig. 45.811 1.210 30 3563 .200

N GENDER TRENING 1.00 2.00 1.00 2.00 20 20 20 20

Tests of Within-Subjects Effects Measure: FREQ Sphericity Assumed Type III Sum of Squares 293.819 832.419 1465.319 Mean Square 97.940 277.473 488.440 Noncent. Parameter 2.807 7.953 14.000 Observed a Power .250 .634 .884

Source TIME TIME * GENDER TIME * TRENING TIME * GENDER * TRENING

df 3 3 3

F .936 2.651 4.667

Sig. .426 .052 .004

528.669

3 108

176.223 104.667

1.684

.175

5.051

.430

Error(TIME) 11304.025 a. Computed using alpha = .05

Tests of Between-Subjects Effects Measure: FREQ Transformed Variable: Average Type III Sum of Source Squares Intercept 33785.156 GENDER 3267.056 TRENING 124.256 GENDER * 77.006 TRENING Error 17683.275 Mean Square 33785.156 3267.056 124.256 77.006 491.202 Noncent. Parameter 68.781 6.651 .253 .157 Observed a Power 1.000 .709 .078 .067

df 1 1 1 1 36

F 68.781 6.651 .253 .157

Sig. .000 .014 .618 .694

a. Computed using alpha = .05


112

Between-Subjects .actor(s). В качестве модели обработки данных (Model...) выбираем вариант .ull .actorial (Полная факторная модель), чтобы получить оценки всех основных факторных эффектов (как внутригруппового, так и межгрупповых факторов) и их взаимодействий. В окошке Расчет суммы квадратов (Sum of Squares:) оставляем предложенный по умолчанию тип 3 (Type III). Оценку контрастов (Contrasts...) и графики (Plots...) не заказываем. Для двух межгрупповых факторов расчет парных сравнений (Post Hoc Tests) заказывать не следует, поскольку тесты парных сравнений выполняются в SPSS в том случае, если число уровней факторов превышает 2. Сохранять параметры модели в матрице данных (Save...) не будем. В Опциях (Options...) заказываем тест на гомогенность дисперсий выборок ставим 'галочку' в окошке Gomogeneity Tests. Следует помнить, что все сделанные выборы в каждом из окошек нужно подтверждать нажатием на кнопку Continue. Начало выполнения ДА инициируем нажатием кнопки OK. Рассмотрим некоторые результаты проведенного ДА (см. табл. 37). В верхней части таблицы приводится резюме по всем факторам и результаты теста Бокса на симметричность ковариационной матрицы. Тест Бокса не обнаружил отклонений от симметричности (р = 0.2). Далее в распечатке представлены результаты анализа влияния внутригруппового фактора Time. Его основной эффект оказался незначим (. = 0.936; р = 0.426), тогда как эффект его взаимодействия с межгрупповым фактором Training статистически высоко достоверен (. = 4.667; р = 0.004) Эффект взаимодействия со вторым межгрупповым фактором Gender оказался на грани достоверности (. = 2.651; р = 0.052). Эффект тройного взаимодействия факторов оценен как недостоверный (. = 1.684; р = 0.175). Ниже даны результаты анализа межгрупповых факторов. Значимым оказался основной эффект фактора Gender (. = 6.651; р = 0.014), а основной эффект фактора Training, и взаимодей-


113

ствие этих факторов статистически не значимы.

ЗАДАНИЯ
1. Дайте содержательную интерпретацию результатов ДА первого и второго примера, обработанных в системе SPSS. 2. В группе из 8 студентов, изучающих второй иностранный язык на четвертом курсе, в течение 3 недель последовательно проводились тесты на знание английского языка (как основного иностранного). В таблице, приведенной ниже, дано число ошибок, допущенных каждым
Студент 1 2 3 4 5 6 7 8 Этапы проверки знаний 1 неделя 2 неделя 3 неделя 55 57 58 44 44 47 61 63 61 65 67 67 40 46 45 70 68 71 49 51 51 58 55 59

из студентов в серии из 100 заданий: Напишите структурную модель для ДА этих данных. Проведите ДА с помощью одной из статистических систем. Дайте содержательную интерпретацию полученных данных. 3. Проводилось исследование влияния эффективности обратной связи, даваемой испытуемым экспериментатором на успешность обучения сенсомоторным навыкам. В эксперименте участвовали 2 группы по 10 испытуемых экспериментальная (давалась обратная связь) и контрольная (не было обратной связи). Ниже представлены данные об успешности деятельности испытуемых в двух сериях эксперимента фоновой (до начала тренировки) и тестовой (после окончаИспытуемый 1 2 3 4 5 6 7 8 9 10 Экспериментальная группа ф о но в а я тестовая 8 9 5 7 3 2 5 7 2 9 6 7 5 8 6 5 4 7 4 9 Контрольная группа фоновая тестовая 3 5 5 5 8 10 2 5 5 3 6 10 6 9 4 5 3 7 5 6


114

ния тренировки): Проведите ДА, используя соответствующую процедуру в любой статистической системе. Дайте содержательную интерпретацию полученных результатов. Постройте графики соотношения средних значений по факторам. 4. В исследовании факторов1, способствующих курению, опрашивались испытуемые, бросившие курить тремя различными способами: постепенное уменьшение выкуренных сигарет, резкое прекращение курения и использование аверсивной терапии. В каждой группе из 5 испытуемых предлагалось оценить по 10-балльной шкале желание испытуемых 'покурить сейчас же'. Испытуемые опрашивались в двух различных ситуациях дома и на работе. Опрос проходил в 2 этапа до прекращения курения и
до того, как бросил курить дома 7 5 8 8 6 8 5 7 8 7 9 4 7 7 8 Время опроса после того, как бросил курить на работе 4 2 4 5 3 6 4 5 5 4 4 2 3 0 3

Как бросил курить

Постепенно

Резко

С терапией

Место курения на работе дома 6 6 4 5 7 7 8 6 5 5 7 7 5 5 6 6 7 6 6 5 8 5 4 3 7 5 5 5 7 6

после. В этом эксперименте у нас один межгрупповой фактор 'Способ бросить курить' и два внутригрупповых
1

Пример заимствован из книги Д.Хауэлла (1998).


115

фактора 'Место курения' и 'Время опроса'. Проведите соответствующий ДА и проинтерпретируйте полученные результаты. 5. Д.Хауэлл пытался доказать своей дочери, что постоянное использование карманного калькулятора в школе и дома отнюдь не способствует развитию навыков устного счета. Чтобы быть более убедительным, он провел небольшое исследование. Среди одноклассников дочери он выбрал 5 человек, у которых был калькулятор, и 5 у которых его не было. Каждый ребенок прошел 3 устных арифметических теста на сложение, вычитание и умножение. Были получены следующие оценки успешности устных вычислений по
Наличие калькулятора Сложение 8 7 есть 9 6 8 10 7 нет 6 9 9 Вычитание 5 5 7 3 5 7 6 5 7 6 Умножение 3 2 3 1 1 6 5 5 8 9

10-балльной шкале: Проведите ДА и установите, подтвердилась ли гипотеза Д.Хауэлла о 'вреде' калькуляторов.


ГЛАВА 5
МНОГОМЕРНЫЙ
5.1. СПЕЦИФИКА
ДИСПЕРСИОННЫЙ АНАЛИЗ

MANOVA
ДА



МНОГОМЕРНОГО

Как было отмечено выше, для модели ДА с повторными измерениями (Repeated-Measures Analysis of Variance) важно выполнение допущения о симметричности ковариационной матрицы или в более общей форме сферичности. Хотя точно оценить степень влияния нарушения этого допущения на результаты ДА достаточно сложно, тем не менее рядом авторов было показано, что ДА со связанными выборками чувствителен к нарушению сферичности при оценке контрастов и простых эффектов. Поэтому многие авторы предлагают использовать другую процедуру ДА многомерный дисперсионный анализ. В англоязычной литературе она получила название MANOVA (Multivariate Analysis of Variance). Данная процедура ДА не требует выполнения допущения о сферичности. Тем не менее, многомерный ДА это более сложная процедура и в ряде случаев менее мощная с точки зрения статистического вывода, особенно на выборках небольшого размера. Поскольку в психологических исследованиях использование малых выборок скорее правило, чем исключение, то при использовании многомерного ДА психологу следует обратить на это особое внимание. Как следует из названия, многомерный ДА это процедура ДА, имеющая дело с несколькими зависимыми переменными одновременно. В психологических экспериментах часто вводится несколько зависимых переменных. Например, в психологии личности нередко используют данные, полученные


117

по 35 шкалам многофакторных личностных опросников, в педагогической психологии измеряют успеваемость, мотивацию, социометрический статус учеников, в психофизиологии при измерении параметров вызванного потенциала измеряют амплитуды и латентности нескольких его компонентов и т.д. Таким образом, каждый испытуемый получает сразу по несколько измерений, которые подвергаются ДА одновременно, в противоположность тому, чтобы последовательно выполнить ДА для каждой переменной в отдельности. Казалось бы, зачем использовать такую дополнительную процедуру ДА, когда можно несколько раз последовательно провести одномерный ДА с каждой из зависимых переменных? Это на первый взгляд резонное предложение не учитывает влияние интеркорреляции между самими зависимыми переменными. При игнорировании связи между зависимыми переменными мы лишаемся важного источника информации о структуре полученных данных. Таким образом, процедура многомерного ДА основана на более общей и более универсальной модели экспериментальных данных по сравнению с одномерным ДА. Одномерный ДА является частным случаем многомерного. С другой стороны, если у исследователя нет оснований считать, что используемые им зависимые переменные связаны корреляционной зависимостью, то, по-видимому, нет и достаточных оснований для применения многомерного ДА, а следует ограничиться одномерным. Для оценки корреляционной связи зависимых переменных можно исследовать корреляционную матрицу этих переменных: если они независимы, то недиагональные элементы матрицы будут незначительно отличаться от нуля. Тест Бартлетта на сферичность обычно используется для строгой статистической оценки корреляционной матрицы: он проверяет, является ли корреляционная матрица единичной матрицей, т.е. матрицей с диагональными элементами, равными 1, и нулевыми недиагональными элементами. Этот тест основан на вычислении детерминанта матрицы ошибок корреляционной матрицы: если детерминант близок к нулю, то одна или не-


118

сколько зависимых переменных могут быть выражены как линейные функции других зависимых переменных. Таким образом, статистическая гипотеза о независимости используемых в эксперименте переменных отвергается, если детерминант не отличен от нуля, и, следовательно, корреляционная матрица не является единичной.

5.2. ДОПУЩЕНИЯ

МНОГОМЕРНОГО

ДА

Поскольку многомерный ДА имеет дело с несколькими переменными, то делается допущение о характере их совместного распределения: в отличие от одномерного ДА, здесь требуется, чтобы переменные имели многомерное нормальное распределение. Второе допущение многомерного ДА требует, чтобы для каждого уровня фактора переменные образовывали одну и ту же дисперсионно-ковариационную матрицу. Как следует из названия, дисперсионно-ковариационная матрица это квадратная матрица, на диагонали которой лежат дисперсии переменных, а ее элементами являются коэффициенты ковариации между переменными.

5.3. М

НОГОМЕРНЫЕ КРИТЕРИИ ДЛЯ ОЦЕНКИ ФАКТОРНЫХ

ЭФФЕКТОВ

В силу наличия в структурной модели многомерного ДА нескольких зависимых переменных и эффекта их корреляции, для многомерного ДА были разработаны отличные от привычных для одномерного ДА сумм квадратов статистические показатели вариативности. Это так называемые многомерные тесты. Эти показатели основываются на вычислении детерминанта произведения двух матриц матрицы, называемой матрицей сумм квадратов и коэффициентов ковариации (Н) на обратную матрицу остаточных сумм квадратов и коэффициентов ковариации (Е-1) H?Е-1. Как следует из их названия, диагональные элементы матриц представляют собой, соответственно, суммы квадратов или остатки сумм квадратов по каждой зависимой переменной, а недиагональные элементы коэффициенты ковариации между ними. Как известно детерминант матрицы является мерой общей вариабельности данных или дисперсии


119

всей матрицы. Для тех читателей, кто не знаком с матричной алгеброй и факторным анализом, напомним, что детерминант может быть вычислен как произведение собственных значений матрицы, поскольку каждое собственное значение является, в свою очередь, частью общей дисперсии. Фактически вычисление собственных значений матрицы H?E-1 реализуется посредством ее факторизации методом главных компонент. Обычно в компьютерных статистических программах вычисляются несколько статистических показателей для многомерной оценки различий между сравниваемыми средними: 1. Критерий Пиллая (Pillais trace):

V=


i = S

S

; + i ; + i

(47)

2. Критерий Уилкса (Wilkss lambda):

W=


i =

(48)

3. Критерий Хотеллинга (Hotelling trace):

T= R=

4. Критерий Роя (Roys largest root):



i ;

(49)

MAX + MAX ;

(50)

где li i-ое собственное значение матрицы, lMAX максимальное собственное значение матрицы, S количество ненулевых собственных значений матрицы. Для каждого из приведенных выше многомерных критериев построены собственные распределения, однако все они могут быть преобразованы в статистики, хорошо аппроксимирующиеся .-распределением. При одной независимой переменной все 4 указанных выше критерия эквивалентны обычной .-статистике одномерного ДА. При выборе наилучшего из 4 критериев обычно исходят из двух важных соображений мощность критерия и его устойчивость к нарушению допущений ДА (или робастность). Для большинства практических ситуаций использования мно-


120

гомерного ДА мощность критериев убывает согласно их месту в следующем списке: Пиллая, Уилкса, Хотеллинга и Роя. Критерий Пиллая является также самым робастным критерием. Это означает, что уровень значимости этого критерия оценивается вполне корректно даже в том случае, когда нарушаются допущения ДА. Последнее немаловажно, поскольку многие исследователи не затрудняют себя выполнением статистических проверок математических допущений ДА.

КОНТРОЛЬНЫЕ

ВОПРОСЫ

1. Каковы основные отличия многомерного ДА от одномерного? 2. Можно ли сказать, что многомерный ДА по своим математическим допущениям более либеральная процедура? 3. Почему важно убедиться, что между включенными в многомерный ДА зависимыми переменными имеется корреляционная связь? 4. Почему результаты нескольких одномерных ДА в принципе неэквивалентны многомерному ДА? 5. Для чего используется тест Бартлетта на сферичность? 6. Какие вы знаете многомерные статистические критерии, оценивающие факторный эффект, и чем они отличаются от одномерного .-критерия? 7. Какой из 4 многомерных критериев считается самым мощным и устойчивым к нарушениям допущений многомерного ДА?

5.4. П

РИМЕР ОБРАБОТКИ ДАННЫХ МНОГОМЕРНЫМ

ДА

В силу сложности вычислительного алгоритма многомерного ДА мы опустим конкретные вычисления факторных эффектов и их взаимодействий и ограничимся лишь самыми необходимыми пояснениями при разборе одного примера и его обработки. Поскольку во многих статистических системах (BMDP, SAS, SPSS) имеются полезные предустановки параметров модели многомерного ДА (установки по умол-


121

чанию), даже не очень искушенному в статистике исследователю использование этой процедуры становится доступным. Обратимся вновь к данным Д.А.Кинга, проводившего эксперимент по изучению привыкания крыс к воздействию наркотика (1986). Кинг регистрировал двигательную активность животных сразу же после инъекции мидозалама. После первой дозы наблюдалось заметное снижение двигательной активности. Но, как и все морфины, мидозалам вызывал быстрое привыкание. Кинг исследовал динамику такого привыкания. Использовались три различные группы по 8 животных (фактор А 'группа': 3 уровня) контрольная и две экспериментальных. Экспериментальные группы отличались тем, что первая группа крыс ('старые условия') исследовалась в тех же окружающих условиях, в которых она и содержались, тогда как условия для второй группы были изменены ('новые условия'). Контрольная группа крыс получала наркотик впервые только в день эксперимента, а две экспериментальные группы получали инъекции в течение нескольких дней до контрольного тестирования. Поскольку использованный наркотик оказывает быстрое действие, особенности двигательного поведения животных в каждой группе оценивались в течение часа после его приема по 6 пятиминутным интервалам наблюдения. Таким образом, в контрольной группе исследовалась первичная реакция на наркотик, а в двух экспериментальных группах типичный эффект привыкания. Поскольку автора главным образом интересовал эффект привыкания, то, выполняя многомерный ДА, мы будем оценивать динамику двигательной активности во времени для трех групп животных. 5 переменных будут являться мерами изменения моторной активности животных во времени. Экспериментальный план Д.А.Кинга выглядит следующим образом: 5 зависимых переменных и один межгрупповой фиксированный фактор (см. табл. 38). Выполняя многомерный ДА, для каждой переменной мы проверяем нулевые гипотезы о равенстве средних показателей двигательной активности в трех различных группах животных.


122 Таблица 38 Данные эксперимента Д.А.Кинга

И н т ервал наб люд е н и я д в иг ат ельной акт ивност и Группа крыс инт.1 150 335 149 159 159 292 297 170 346 426 359 272 200 366 371 447 282 317 362 338 263 138 329 292 инт. 2 71 156 91 127 35 184 66 42 177 236 183 82 263 263 270 294 225 85 144 91 141 16 62 104 инт. 3 59 160 115 212 75 246 96 66 192 76 123 85 216 164 308 216 134 120 114 77 142 95 6 184 инт. 4 132 117 43 71 71 225 209 114 239 102 183 101 241 220 219 284 189 131 115 108 120 39 93 193 инт. 5 74 230 154 224 34 170 74 81 140 232 30 98 227 180 267 225 169 205 127 169 195 55 67 122

контрольная

в старых условиях

в новых условиях

Рассмотрим, как обрабатываются данные нашего примера в системе SPSS. Результаты измерений вводятся в Редактор Данных (Data Editor) в виде шести переменных, соответствующих шести интервалам наблюдения: в каждой переменной по 8?3=24 испытуемых, т.е. данные по каждой группе животных вводятся в столбец-переменную последовательно. Во фрагменте электронной таблицы SPSS (см. рис. 17) они обозначены как инт1, инт2 ... инт6. Седьмая переменная (группа) кодирует принадлежность животного к одной из экспериментальных групп: 1 контрольная группа, 2 живот-


123

Рис. 17. Пример ввода данных эксперимента Д.А.Кинга в Редактор Данных SPSS

ные в старых условиях, 3 животные в новых условиях. Таким образом, в итоге мы получаем матрицу данных 24?7. После окончания ввода данных в меню статистических методов Статистика (Statistics) следует выбрать группу методов Общая линейная модель (General Linear Model), а в ней нужную нам процедуру ОЛМ Многооткликовая (Multivariate...). Далее необходимо указать зависимые переменные, для чего выделяем их в левом окне и, нажимая на кнопку со стрелочкой, переносим в окно Зависимые переменные (Dependent Variables). Затем следует указать, какая переменная соответствует фактору. Также выделяем ее в левом окне и переносим в окно Фиксированные факторы (.ixed .actors), т.е. факторы с фиксированными уровнями. Поскольку в нашем примере нет переменных-ковариат (Covariates), то в соответствующем окне мы ничего не указываем. В процедуре многомерного ДА при работе с данными появляется еще одна возможность: числовые значения каждой переменной могут быть трансформированы посредством процедуры взвешивания по методу наименьших квадратов: Взвешенный МНК (WLS Weight weighted least-squares). Эта воз-


124

можность заключается в том, что в данных можно указать отдельную переменную, с помощью которой результаты проведенных измерений получат различный вес. Подобная трансформация, как правило, выполняется при необходимости компенсировать различия в точности измерений используемых в анализе переменных. Пользователям, не знакомым с использованием данного приема, мы не рекомендуем его применение. Пользователь может выбрать одну из моделей обработки данных ДА: Модель (Model...). Выбор варианта Полная факторная (.ull .actorial) означает, что рассчитываются все основные факторные эффекты (как внутригрупповых, так и межгрупповых факторов) и их взаимодействия. Вариант Настраиваемая (Custom) означает, что можно выбрать оценку основных факторных эффектов или их взаимодействия, а также и ограничить уровень факторного взаимодействия. Поскольку в нашем примере имеется лишь один фактор, то мы выбираем вариант Полная факторная. Об изменении способа расчета сумм квадратов (опция Сумма квадратов Sum of Squares:) стоит думать в случае наличия более, чем одного фактора и неравного количества испытуемых в группах (так называемые несбалансированные данные). Только в этом случае появляется неоднозначность в решении задачи разделения общей дисперсии на составляющие. Это связано с тем, что оцениваемые различия между средними зависят от влияния эффектов других факторов. Поэтому для проверки разных гипотез можно использовать различные методы расчета сумм квадратов. Например, предложенный по умолчанию метод (Тип III) соответствует так называемому уникальному, или регрессионному, алгоритму, когда при оценке любого факторного эффекта учитываются результаты оценки всех остальных факторных эффектов. Для того, чтобы разобраться в подобных тонкостях, которые лишь незначительно влияют на результат, мы советуем читателю обратиться к руководству по использованию конкретной статистической системы. Предложенный по умолчанию Тип III (Type III) является наиболее универсальным выбором. В окне выбора модели предлагается еще одна возможность, специ-


125

фичная для многомерного ДА оценить отличие от нуля сравниваемых средних по различным группам и переменным: Включить в модель свободный член (Include intercept in model). В различных статистических системах эта функция может называться по-разному: MEAN, CONSTANT или INTERCEPT. Эта функция может быть очень полезна для психологов в том случае, если включенные в анализ переменные представляют собой отклонения индивидуальных оценок испытуемых от тестовой нормы. Тогда как дополнительный результат анализа мы получим по каждому фактору и каждой переменной статистическую оценку отличия данной выборки испытуемых от нормы. Это сравнение выполняется также с помощью многомерных тестов. Если пользователь хочет оценить соотношение между уровнями фактора, то следует выбрать один из 6 методов оценки контрастов: Контрасты (Contrаsts...), по умолчанию контрасты не оцениваются. Опытным пользователям при необходимости работы с контрастами мы советуем обязательно обратиться к соответствующему описанию статистической системы SPSS. Неопытным коллегам рекомендуем пользоваться установками по умолчанию. При необходимости в результаты могут быть включены графики соотношения средних значений измеряемой переменной для различных уровней различных факторов: Графики (Plots...). Среди методов множественных парных сравнений (Апостериори Post Hoc Tests) выберем тест ГеймсаХауэлла. Для того, чтобы рассчитанные параметры модели сохранить, в матрице данных предусмотрена возможность их записи как новых переменных: Сохранить (Save...). Эти новые переменные могут быть предметом специального анализа на предмет соответствия обработанных данных используемой модели ДА. Дополнительно можно заказать для выдачи в результаты анализа много дополнительных показателей, характеризующих данные и модель ДА: Параметры (Options...) Как и в предыдущих случаях, для начала выполнения данной процедуры ДА требуется нажать кнопку OK.


126

В окне результатов может быть представлена очень обширная информация, состоящая из нескольких страниц таблиц и графиков. Мы приведем здесь лишь основные результаты (см. табл. 39) и сделаем необходимые комментарии. В верхней части таблицы (см. табл. 39, А) представлены результаты проверки допущений многомерного ДА. М-тест Бокса оценивает равенство дисперсионно-ковариационных матриц для каждого уровня фактора. Полученные результаты показывают (. = 0.929, p = 0.603), что у нас нет оснований говорить о нарушении этого допущения. Результаты теста Бартлетта на сферичность показывают, что корреляционная матрица переменных не является единичной матрицей, следовательно наши переменные связаны корреляционной связью (аппрокс.c 2 = 73.873, р < 0.005). В следующей части таблицы (см. табл. 39, Б) даны результаты всех четырех отмеченных выше многомерных тестов: по всем тестам основной эффект фактора 'группа животных' (Group) оказался высоко значимым. Таким образом, проверяемая нами нулевая гипотеза о равенстве групповых средних может быть отвергнута. Еще ниже представлены результаты уже известных нам тестов одномерного ДА по каждой из 6 переменных. Видно, что по каждой переменной обнаружен статистически достоверный эффект фактора 'группа животных' (р < 0.005). Для того, чтобы разобрать, какие средние различаются между собой, в самой нижней части таблицы (см. табл. 39, Г) представлены результаты множественных (6 сравнений по каждой из 6 переменных) парных сравнений по критерию ГеймсаХауэлла. В статистической системе SPSS имеется возможность включать в многомерный ДА не только межгрупповые, но и внутригрупповые факторы, однако эта возможность реализуется с помощью специального командного режима выполнения статистических процедур (Comand Syntax). С этими дополнительными возможностями можно ознакомиться в специальном руководстве по использованию Comand Syntax, либо обратившись к режиму 'Помощь' (Help) из основного меню и выбрав в нем раздел Syntax Guide, а в нем подраздел Advanced Statistics.


127 Таблица 39 Результаты многомерного ДА в системе SPSS 8.01

О б щ а я Л и н е йн ая М о д ел ь
А
Box's Test of Equality of Covariance Matrices Box's M F df1 df2 Sig. 69.121 .929 42 1309 .603

Bartlett's Test of Sphericity Likelihood Ratio Approx. Chi-Square df Sig. .000 73.873 20 .000

B e t w een - S u b j ect s F act o r N 8 8 8

гр у п п а ж ив о т н ы х

1.0 0 2.0 0 3.0 0

Б
M u l t iv a r ia t e T e s t s Эф ф е к т In t e rc e p t Зн а ч е н и е .96 0 .04 0 24 .0 3 9 24 .0 3 9 .84 1 .30 8 1.76 5 1.4 2 5 . 64 .1 0 5 64 .1 0 5 64 .1 0 5 64 .1 0 5 2.0 5 7 2.14 0 2.20 7 4.0 3 8 С т. св. ги п о т е з ы 6.00 0 6.00 0 6.00 0 6.00 0 1 2 .000 1 2 .000 1 2 .000 6.00 0 Ст .с в . ош и б к и 1 6 .000 1 6 .000 1 6 .000 1 6 .000 3 4 .000 3 2 .000 3 0 .000 1 7 .000 Зн а ч . .00 0 .00 0 .00 0 .00 0 .04 9 .04 3 .03 9 .01 1

Сл е д П и л л а я Лям б д а У и л к с а Сл е д Х о т е л л и н г а
Н а иб ол ь ш и й к орень Р оя

Г Р У ППА

Сл е д П и л л а я Лям б д а У и л к с а Сл е д Х о т е л л и н г а
Н а иб ол ь ш и й к орень Р оя

В
Te st s o f B e t w een - S ub jec t s E f fe c t s С у мма к в ад ра т о в ти п а I I I
72 7 9 3 .00 0 1 5 24 25 .3 3 3 7 546 8 .0 0 0 16 9 1 3 .0 8 3 30 4 0 3 .58 3 90 3 7 .0 0 0 19 3 7 4 4 8 .4 5 551 0 4 .1 6 7 4 8 39 36 .0 0 0 44 8 5 4 0 .0 4 2 5 2 77 70 .04 2 52 4 8 0 8 .3 7 5 72 7 9 3 .00 0 1 5 24 25 .3 3 3 7 546 8 .0 0 0 16 9 1 3 .0 8 3 30 4 0 3 .58 3 90 3 7 .0 0 0 1 221 0 1 .62 5 1 6 46 6 8 .50 0 8 216 0 .0 0 0 95 9 3 7 .87 5 78 0 7 5 .3 7 5 10 5 9 8 5 .6 2 5 2 1 32 34 3.0 87 2 1 9 8 .0 0 0 64 1 5 6 4 .0 0 0 56 1 3 9 1 .0 0 0 63 6 2 4 9 .0 0 0 63 9 8 3 1 .0 0 0 19 4 8 9 4 .6 2 5 31 7 0 9 3 .8 3 3 15 7 6 2 8 .0 0 0 1 128 5 0 .95 8 10 8 4 7 8 .9 5 8 11 5 0 2 2 .6 2 5

Ис т о ч н и к С к ор рект и ров ан ная мо д е л ь

З а в и с и ма я п е р е ме н н а я

ст.св . 2 2 2 2 2 2 1 1 1 1 1 1 2 2 2 2 2 2 21 21 21 21 21 21 24 24 24 24 24 24 23 23 23 23 23 23

Ср е д н и й к в ад ра т
36 3 9 6 .50 0 7 6 21 2.6 6 7 3 773 4 .0 0 0 8 456 .54 2 1 5 20 1.7 9 2 45 1 8 .5 0 0 19 3 7 4 4 8 .4 5 551 0 4 .1 6 7 4 8 39 36 .0 0 0 44 8 5 4 0 .0 4 2 5 2 77 70 .04 2 52 4 8 0 8 .3 7 5 36 3 9 6 .50 0 7 6 21 2.6 6 7 3 773 4 .0 0 0 8 456 .54 2 1 5 20 1.7 9 2 45 1 8 .5 0 0 5 814 .3 6 3 78 4 1 .3 5 7 39 1 2 .3 8 1 45 6 8 .4 7 0 3 7 17 .87 5 50 4 6 .9 3 5

.
6.26 0 9.7 1 9 9.6 4 5 1.85 1 4.0 8 9 .89 5 3 33.2 1 8 70 .7 9 2 12 3 .69 3 98 .1 8 2 14 1 .95 5 10 3 .98 6 6.26 0 9.7 1 9 9.6 4 5 1.85 1 4.0 8 9 .89 5

Зн а ч .

I n t e r c ept

Г Р У ППА

Оши б к а

Ит о г

С к ор рект и ров ан ны й итог

1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6

ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин ин

т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т т

е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е е

рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв рв

ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал ал

.007 .00 7 .001 .00 1 .001 .00 1 .182 .18 2 .032 .03 2 .424 .42 4 .000 .00 0 .000 .00 0 .000 .00 0 .000 .00 0 .000 .00 0 .000 .00 0 .007 .00 7 .001 .00 1 .001 .00 1 .182 .18 2 .032 .03 2 .424 .42 4


128 Таблица 39 (продолжение)
Г Г
Множественные сравнения
ГеймсХауэлл Геймз-Хоуелл

(I-J)-я Стд. разность Зависимая переменная (I) группапживотныхтн(J) группа животных нсредних Зависимая перемен груп а живо группа живот ошибка 1 интервал 1.00 2.00 -134.50* 38.126 3.00 -76.25 38.126 2.00 1.00 134.50* 38.126 3.00 58.25 38.126 3.00 1.00 76.25 38.126 2.00 -58.25 38.126 2 интервал 1.00 2.00 -171.50* 44.276 3.00 -5.00 44.276 2.00 1.00 171.50* 44.276 3.00 166.50* 44.276 3.00 1.00 5.00 44.276 2.00 -166.50* 44.276 3 интервал 1.00 2.00 -124.50* 31.275 3.00 -12.00 31.275 2.00 1.00 124.50* 31.275 3.00 112.50* 31.275 3.00 1.00 12.00 31.275 2.00 -112.50* 31.275 4 интервал 1.00 2.00 -43.88 33.795 3.00 19.63 33.795 2.00 1.00 43.88 33.795 3.00 63.50 33.795 3.00 1.00 -19.63 33.795 2.00 -63.50 33.795 5 интервал 1.00 2.00 -75.88 30.487 3.00 -.75 30.487 2.00 1.00 75.88 30.487 3.00 75.13 30.487 3.00 1.00 .75 30.487 2.00 -75.13 30.487 6 интервал 1.00 2.00 -44.75 35.521 3.00 -8.50 35.521 2.00 1.00 44.75 35.521 3.00 36.25 35.521 3.00 1.00 8.50 35.521 2.00 -36.25 35.521 Основано на наблюденных средних. *. Разность средних значима на уровне .05.

Знач. .012 .138 .012 .296 .138 .296 .012 .991 .012 .008 .991 .008 .004 .912 .004 .012 .912 .012 .480 .805 .480 .175 .805 .175 .088 1.000 .088 .058 1.000 .058 .498 .964 .498 .562 .964 .562

95% доверительный интервал Нижняя Верхняя граница граница -238.53 -30.47 -173.85 21.35 30.47 238.53 -39.76 156.26 -21.35 173.85 -156.26 39.76 -304.90 -38.10 -107.46 97.46 38.10 304.90 48.81 284.19 -97.46 107.46 -284.19 -48.81 -206.87 -42.13 -88.79 64.79 42.13 206.87 25.53 199.47 -64.79 88.79 -199.47 -25.53 -140.79 53.04 -62.34 101.59 -53.04 140.79 -24.49 151.49 -101.59 62.34 -151.49 24.49 -161.91 10.16 -77.46 75.96 -10.16 161.91 -2.37 152.62 -75.96 77.46 -152.62 2.37 -146.19 56.69 -95.55 78.55 -56.69 146.19 -55.58 128.08 -78.55 95.55 -128.08 55.58


129

ЗАДАНИЯ
1. Двум группам из 6 испытуемых-добровольцев в каждой вводились две различные дозы стимулирующего лекарства (фактор 'доза': 2 уровня). В ходе эксперимента измерялось их функциональное состояние по поведенческому (порог слуховой чувствительности) и физиологическому (частота пульса ЧСС) показателям. В таблице приведены экспериментальные данные в условных единицах относительно исходного (фонового) уровня функционального состояния, оцененного до эксперимента. Обработайте полученные данные методом многомерного ДА в одной из статистических систем и оцените влияние дозы лекарства на каждую зависимую переменную.
Первая группа испытуемых Доза 1 1 1 1 1 1 Порог 3.4 3.4 3.3 3.4 3.3 3.3 ЧСС 2.2 2.2 2.3 2.3 2.2 2.0 Вторая группа испытуемых Доза 2 2 2 2 2 2 Порог 3.3 3.2 3.2 3.2 3.2 3.3 ЧСС 2.8 2.6 2.7 2.6 2.7 2.6

2. В экспериментах А.Н.Гусева и С.А.Шапкина (неопубликованные данные, 1994) изучалось влияние времени суток (межгрупповой фактор 1: 2 уровня 'утро' и 'вечер') и мотивации достижения испытуемых (межгрупповой фактор 2: 2 уровня 'мотивированные на избегание неудачи' и 'мотивированные на успех') на эффективность обнаружения зрительных сигналов в условиях повышенной бдительности. В таблице приведены значения 4-х показателей времени реакции испытуемых (ВР). Обработайте полученные данные методом многомерного ДА в одной из статистических систем и оцените влияние времени суток и мотивации достижения на каждую зависимую переменную: среднее ВР на правильные обнаружения ВР(Hit), среднее ВР на ложные тревоги ВР(.A), среднеквадратичное отклонение ВР на правиль-


130

ные обнаружения BH (Hit ) и среднеквадратичное отклонение ВР на ложные тревоги BH (FA ) . Оцените для каждой переменной эффект взаимодействия факторов 'время суток' и 'мотивация достижения'. Есть ли различие в оценках факторных эффектов и их взаимодействия, проведенных с помощью многомерных тестов (то, что делает MANOVA) и .-критерия (то, что делает ANOVA)?
? исп-го 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 ВР(Hit) 285 257 289 266 264 370 269 331 356 416 352 283 373 305 298 361 367 368 347 325 285 ВР(FA) 345 268 324 238 258 378 252 298 300 355 331 232 324 252 356 359 314 266 354 285 287



BH (Hit

)



BH ( FA

)

Время дня 2 2 1 2 2 1 2 1 1 1 2 2 1 1 1 2 1 2 1 2 1

Мотивация 1 1 2 2 2 2 1 1 1 2 2 1 1 1 2 2 2 2 2 2 2

97 36 38 93 30 77 50 88 124 71 75 51 81 49 29 70 35 111 72 73 34

143 103 40 95 38 107 45 64 68 51 77 41 74 36 49 88 41 48 85 53 31

3. В исследовании Л.Я.Дорфмана и Г.Я.Ковалевой (неопубликованные данные, 1999) изучалась связь различных индивидуальных особенностей испытуемых. Каждый испытуемый оценивался по выраженности четырех субмодальностей Я: 'Я авторское', 'Я воплощенное',


131

'Я превращенное', 'Я вторящее' (Я1, Я2, Я3 и Я4)1. Кроме того у каждого испытуемого оценивались 2 показателя когнитивного стиля 'концептуальная дифференциация' (КД1 и КД2). По степени оригинальности мышления (креативности) испытуемые были разбиты на 2 группы с высокими и более низкими показателями оригинальности (межгрупповой фактор: 2 уровня). Авторов данного исследования интересовал вопрос о связи показателей субмодальностей Я и указанного выше когнитивного стиля с уровнем оригинальности (креативности) испытуемых. Обработайте приведенные ниже в таблице данные методом многомерного ДА в одной из статистических систем и оцените влияние оригинальности на 6 указанных выше зависимых переменных. Есть ли различие в оценках эффекта фактора 'оригинальность', проведенных с помощью многомерных тестов и .-критерия?
? исп-го 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Я1 42 52 41 40 48 44 35 51 39 40 44 47 43 49 44 48 Я2 43 48 45 45 46 42 45 50 47 44 41 49 48 47 47 41 Я3 54 49 45 40 51 45 43 53 54 49 49 50 48 51 53 46 Я4 38 35 31 48 42 21 38 28 36 36 35 34 37 38 39 26 КД1 7 12 11 14 6 17 7 10 7 12 33 9 11 17 9 9 КД2 10 9 6 7 15 9 12 10 8 7 12 10 7 8 8 7 Оригинальность 1 1 2 1 2 1 2 1 2 1 2 1 1 2 2 2

1 Ч етыре субмодальности Я рассматриваются автором в рамках его психологической концепции метаиндивидуального мира как некие сущностные характеристики Я (см. Дорфман Л.Я., 19931998).


132

ПРИЛОЖЕНИЕ
Критические значения .-распределения для уровня значимости p = 0.05

Число ст. св. знаменателя

Число степеней свободы числителя

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 50 60 120 200 500 1000

1 161.4 18.51 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.30 4.26 4.23 4.20 4.17 4.08 4.03 4.00 3.92 3.89 3.86 3.85

2 199.5 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.44 3.40 3.37 3.34 3.32 3.23 3.18 3.15 3.07 3.04 3.01 3.01

3 215.8 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.05 3.01 2.98 2.95 2.92 2.84 2.79 2.76 2.68 2.65 2.62 2.61

4 224.8 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.82 2.78 2.74 2.71 2.69 2.61 2.56 2.53 2.45 2.42 2.39 2.38

5 230.0 19.30 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.66 2.62 2.59 2.56 2.53 2.45 2.40 2.37 2.29 2.26 2.23 2.22

6 233.8 19.33 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.55 2.51 2.47 2.45 2.42 2.34 2.22 2.25 2.18 2.14 2.12 2.11

7 236.5 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.46 2.42 2.39 2.36 2.33 2.25 2.20 2.17 2.09 2.06 2.03 2.02

8 238.6 19.37 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.40 2.36 2.32 2.29 2.27 2.18 2.13 2.10 2.02 1.98 1.96 1.95

9 240.1 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 2.39 2.34 2.30 2.27 2.24 2.21 2.12 2.07 2.04 1.96 1.93 1.90 1.89

10 242.1 19.40 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 2.35 2.30 2.25 2.22 2.19 2.16 2.08 2.03 1.99 1.91 1.88 1.85 1.84


133

РЕКОМЕНДУЕМАЯ

ЛИТЕРАТУРА

Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир, 1982. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. М.: Прогресс, 1976. Готтсданкер Р. Основы психологического эксперимента. М.: Издво Моск. ун-та, 1982. Кимбл Г. Как правильно пользоваться статистикой. М.: Финансы и статистика, 1982. Корнилова Т.В. Введение в психологический эксперимент. М.: Изд-во Моск. ун-та; ЧеРо, 1997. Кулаичев А.П. Методы и средства анализа данных в среде Windows. Stadia 6.0. М.: Российское психологическое общество, 1998. Лакин Г.Ф. Биометрия. М.: Высшая школа, 1980. Налимов В.В. Теория эксперимента. М.: Наука, 1971. Руководство пользователя. SPSS Base 8.0. М.: СПСС Русь, 1998. Руководство по применению. SPSS Base 8.0. М.: СПСС Русь, 1998. Сидоренко Е.В. Методы математической обработки в психологии. СПб.: Социально-психологический центр, 1996. Суходольский Г.В. Основы математической статистики для психологов. 2-е изд. СПб.: Изд-во СПб. ун-та, 1998. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. М.: Инфра-М, 1998. Шапкин С.А. Экспериментальное изучение волевых процессов. М.: Смысл, 1997. Шеффе Г. Дисперсионный анализ. М.: Наука, 1980. Dancey C., Reidy J. Statistics Without Maths for Psychology. Usung SPSS for Windows. Prentice Hall, 1999. Howell D. .undamental Statistics for the Behavioral Sciences (3rd ed.). Belmont, CA: Duxbury Press, 1995. Howell D. Statistical Methods for Psychology (4th ed.). Belmont, CA: Duxbury Press, 1998. Levine G. A Guide to SPSS for Analisis of Variance. Lawrence Erlbaum Associates, Publishers. Hillsdale, 1991. Kirk R. Experimental Design: Procedures for the Behavioral Sciences. (3rd ed.) Pacific Grove, CA: Brooks/Cole, 1995. Norusis M. SPSS Inc. SPSS for Windows: Advanced Statistics, Release 6.0. Chicago: SPSS Inc, 1993. SPSS Advanced Statistics 7.5. Chicago: SPSS Inc, 1997.


134

Содержание
П
РЕДИСЛОВИЕ

1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7.

ОСНОВНЫЕ ПОНЯТИЯ .................................................................... 7 ЛИНЕЙНАЯ МОДЕЛЬ ДИСПЕРСИОННОГО АНАЛИЗА ................................... 9 НУЛЕВАЯ ГИПОТЕЗА В ДА ............................................................ 10 МАТЕМАТИЧЕСКИЕ ДОПУЩЕНИЯ ДА ................................................. 11 ПОСЛЕДСТВИЯ НАРУШЕНИЯ ДОПУЩЕНИЙ ДА ..................................... 12 КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ ДИСПЕРСИЙ ............................. 13 ОБЩАЯ ЛОГИКА ДА ................................................................... 13

............................................................................ 3 ГЛАВА 1 СУЩНОСТЬ И ЛОГИКА ДИСПЕРСИОННОГО АНАЛИЗА

Г
2.1. 2.2. 2.3. 2.4. 2.5.

ЛАВА

2
19 24 28 29 31 31 32 36 41

ПРОЦЕДУРА ОЦЕНКИ .-ОТНОШЕНИЯ ............................................... ПРОЦЕДУРЫ МНОЖЕСТВЕННОГО СРАВНЕНИЯ СРЕДНИХ В ДА ................... ДА С ВЫБОРКАМИ НЕРАВНОГО РАЗМЕРА .......................................... ОЦЕНКА СИЛЫ ФАКТОРНОГО ЭФФЕКТА ............................................. О ДВУХ МОДЕЛЯХ ДИСПЕРСИОННОГО АНАЛИЗА ................................... КОНТРОЛЬНЫЕ ВОПРОСЫ .......................................................... 2.6. РАБОТА С ОДНОФАКТОРНЫМ ДИСПЕРСИОННЫМ АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ STADIA 6.0 ................................... 2.7. РАБОТА С ОДНОФАКТОРНЫМ ДИСПЕРСИОННЫМ АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ SPSS 8.0.1 .................................... ЗАДАНИЯ .............................................................................

О

ДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Г
3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8. 3.9.

ЛАВА

3
4 4 4 4 3 5 6 9

ОСОБЕННОСТИ ДВУХФАКТОРНОГО ДА .............................................. ЛИНЕЙНАЯ МОДЕЛЬ ДВУХФАКТОРНОГО ДА ........................................ ПРОБЛЕМА ВЗАИМОДЕЙСТВИЯ ФАКТОРОВ ......................................... ОБРАБОТКА ДАННЫХ ДВУХФАКТОРНОГО ЭКСПЕРИМЕНТА ........................ МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ СРЕДНИХ В ДВУХФАКТОРНОМ ДА ............................................................. ОЦЕНКА ВЕЛИЧИНЫ ФАКТОРНОГО ЭФФЕКТА ....................................... ОЦЕНКА ПРОСТЫХ ЭФФЕКТОВ ........................................................ ДВУХФАКТОРНЫЙ ДА С ВЫБОРКАМИ НЕРАВНОГО РАЗМЕРА ................... СЛОЖНОСТИ ДА С БОЛЬШИМ КОЛИЧЕСТВОМ ФАКТОРОВ ...................... КОНТРОЛЬНЫЕ ВОПРОСЫ ...........................................................

ДВУХФАКТОРНЫЙ

ДИСПЕРСИОННЫЙ АНАЛИЗ

55 56 57 61 61 64


135 3.10. Р
АБОТА С ДВУХФАКТОРНЫМ ДИСПЕРСИОННЫМ АНАЛИЗОМ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ

3.11. РАБОТА З

STADIA 6.0 ................................... 65

С ДВУХФАКТОРНЫМ ДИСПЕРСИОННЫМ АНАЛИЗОМ

В СТАТИСТИЧЕСКОЙ СИСТЕМЕ АДАНИЯ

SPSS 8.0.1 .................................... 71 .............................................................................. 80

Г ДИСПЕРСИОННЫЙ

ЛАВА

4

АНАЛИЗ ДАННЫХ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ

4.1. ОСОБЕННОСТИ ДА С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ ............................ 84 4.2. СТРУКТУРНАЯ МОДЕЛЬ ДА С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ ................... 86 4.3. СТАТИСТИЧЕСКИЕ КРИТЕРИИ И ПРЕДПОЛОЖЕНИЯ, ИСПОЛЬЗУЕМЫЕ В ДА С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ .......................................... 87 4.4. ПРИМЕР ОБРАБОТКИ ОДНОФАКТОРНОГО ЭКСПЕРИМЕНТА С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ ................................................... 89 4.5. ДВУХФАКТОРНЫЙ ДА С ВНУТРИГРУППОВЫМИ И МЕЖГРУППОВЫМИ ФАКТОРАМИ ................................................. 93 КОНТРОЛЬНЫЕ ВОПРОСЫ ......................................................... 101 4.6. ОБРАБОТКА ДАННЫХ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ STADIA 6.0 ................................. 102 4.7. ОБРАБОТКА ДАННЫХ С ПОВТОРНЫМИ ИЗМЕРЕНИЯМИ В СТАТИСТИЧЕСКОЙ СИСТЕМЕ SPSS 8.01 ................................... 104 ЗАДАНИЯ ............................................................................ 113

Г МНОГОМЕРНЫЙ

ЛАВА

5 MANOVA
116 118 118 120 120 129

ДИСПЕРСИОННЫЙ АНАЛИЗ

5.1. СПЕЦИФИКА МНОГОМЕРНОГО ДА ................................................ 5.2. ДОПУЩЕНИЯ МНОГОМЕРНОГО ДА ................................................. 5.3. МНОГОМЕРНЫЕ КРИТЕРИИ ДЛЯ ОЦЕНКИ ФАКТОРНЫХ ЭФФЕКТОВ ............ КОНТРОЛЬНЫЕ ВОПРОСЫ ......................................................... 5.4. ПРИМЕР ОБРАБОТКИ ДАННЫХ МНОГОМЕРНЫМ ДА ............................. ЗАДАНИЯ ............................................................................

ПРИЛОЖЕНИЕ .......................................................................... 132 РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА ....................................................... 133


А

ЛЕКСЕЙ

НИКОЛАЕВИЧ Г

УСЕВ

ДИСПЕРСИОННЫЙ

АНАЛИЗ В ЭКСПЕРИМЕНТАЛЬНОЙ ПСИХОЛОГИИ

У
К Р

ЧЕБНОЕ ПОСОБИЕ

ЕДАКТОР

М.И.ЧЕРКАССКАЯ

ОМПЬЮТЕРНАЯ ВЕРСТКА И ДИЗАЙН ОБЛОЖКИ

А.И.Ч

ЕКАЛИНОЙ

У А

ЧЕБНО-МЕТОДИЧЕСКИЙ КОЛЛЕКТОР

'ПСИХОЛОГИЯ' ЛИЦЕНЗИЯ ? 00451 от 15 ноября 1999 г.

ДРЕС:

107005, Г. МОСКВА, УЛ. БАУМАНСКАЯ, Д. 50/12, СТР. 1. 103009, Г. МОСКВА, УЛ. Б. НИКИТСКАЯ, Д. 4. ТЕЛ. (095)203-35-71, ТЕЛ./ФАКС (095)203-35-65. E-MAIL: COLLECT@MAIL.RU. 26.06.2000. ФОРМАТ 60?84/16. ТИРАЖ 1000. . ГАРНИТУРА TIMESET. УСЛ. ПЕЧ.Л. 8,5

П

ОДПИСАНО В ПЕЧАТЬ

БУМАГА

ОФСЕТНАЯ