Text
                    JAN OKON
ANALIZA CZYNNIKOWA
W PSYCHOLOGII
Wydanie drugie
Warszawa 1964
Pafistwowe wydawnictwo naukowe

Я. ОНУНЬ ФАКТОРНЫЙ АНАЛИЗ Перевод с польского Г 3 ДАВИДОВИЧА Научный редактор В. М. ЖУКОВСКАЯ Статистика Москва 1974
0183—173 008(01)—73 110—73 БИБЛИОТЕЧКА ИНОСТРАННЫХ КНИГ для экономистов И СТАТИСТИКОВ Издательство «Статистика» выпускает на русском языке серию книг иностранных авторов по статистике, рассчитанных на круг читателей, нуждающихся в пополнении своих математических и ста- тистических знаний. Задача книг — ознакомить статистиков и эко- номистов на не очень сложном материале с современными методами, которые за рубежом применяются в экономическом анализе и в различных хозяйственных расчетах. Среди намеченных к выпуску имеются книги по общим вопро- сам статистики и книги, посвященные статистическому анализу в отдельных областях экономики. Издательство старается подбирать работы, не перегруженные сложными теоретическими изысканиями, но подводящие к применению таких изысканий на практике. Уже вышли из печати книги: 1. М. Б р о у д и. О статистическом рассуждении. 2. А Бернстейн. Справочник статистических решений.- 3. У. Дж. Р е й х м а н. Применение статистики. 4. X. Крыньский. Математика для экономистов. 5. С.Дайменд. Мир вероятностей. 6. А. X ь ю т с о н. Дисперсионный анализ. 7. С. Лизер. Эконометрические методы и задачи. 8. Эм. Б о р е л ь, Р. Дельтейль, Р. Ю р о н. Ве- роятности, ошибки. 9. Л. С т о л е р ю. Равновесие и экономический рост. Подготавливается к изданию С. С и р л, У. Г о с м а н. Матричная алгебра в экономике РЕДКОЛЛЕГИЯ Л. С. КУЧАЕВ, П. П. МАСЛОВ, Л. Е. МИНЦ И. С. ПАСХАВЕР, Г. Г. ПИРОГОВ, 3. А. СУМНИК, Е. М. ЧЕТЫРКИН, Р. М, ЭНТОВ © перевод на русский язык «Статистика, 1973
ПРЕДИСЛОВИЕ К РУССКОМУ ПЕРЕВОДУ В последние два десятилетия сфера применения факторного ана- лиза, этого специфического раздела современной многомерной статис- тики, быстро расширяется. Если в начале нашего века методы фактор- ного анализа были созданы и разрабатывались исключительно для нужд психологии, то теперь становится все более очевидной универ- сальность этих методов. Сейчас можно назвать уже сотни работ, сооб- щающих о применении факторного анализа для исследований в области экономики, социологии, биологии, медицины, метеорологии, палеон- тологии, физической и экономической географии и др. [235—244]. Накопленный опыт подтверждает ценность факторного анализа как инструмента научного исследования. Столь широкий интерес к приложению методов факторного анали- за связан с тем, что эти методы позволяют с некоторым приближением решать одну из наиболее распространенных задач научцого иссле- дования, а именно задачу построения той или иной схемы классифи- кации, т. е. компактного содержательного описания исследуе- мого явления, на основе обработки больших информационных мас- сивов. В очень многих случаях информация об изучаемом явлении может быть представлена в форме таблицы данных (как количествен- ных, так и качественных), в которой строки соответствуют множеству наблюдений за состоянием изучаемого явления, а столбцы — мно- жеству характеристик или признаков, описывающих данное явление. Так, в экономических исследованиях в качестве наблюдений (или объектов наблюдения) чаще всего выступают предприятия, виды продукции или отрасли, а при исследовании динамики экономических явлений — члены временных рядов: год, квартал, месяц и т. д. Каж- дое из наблюдаемых предприятий может быть охарактеризовано та- кими, например, признаками, как число занятых, стоимость основных производственных фондов, направление и степень специализации, 5
наличие филиалов и др. В региональных исследованиях такого рода таблицы получили название матриц географических данных: строки матриц соответствуют дробным территориальным единицам, пред- ставляющим изучаемый региональный комплекс. Исследователь может располагать большим объемом наблюде- ний, в набор признаков теоретически могут быть включены все непо- средственно наблюдаемые характеристики изучаемого явления. Но даже в этом случае информация, содержащаяся в таблице подоб- ного рода, явно недостаточна для понимания существа явления и для целенаправленного управления этим явлением. Такая таблица пред- ставляет собой лишь набор чисел, т. е. как бы <прединформацию», и только анализ позволит выявить закономерности, скрытые за на- бором чисел. Перед исследователем, работающим с таблицами подобного рода, часто встает вопрос: нельзя ли выразить заключенную в таблице информацию в более компактной форме, поскольку естественно по- лагать, что компактная форма отражает наиболее существенные, закономерные аспекты варьирования признаков от объекта к объекту. Компактность представления информации может быть достигнута как путем группировки объектов со сходными сочетаниями значений признаков (задача таксономии), так и за счет группировки признаков, с общим характером изменений от объекта к объекту (задача анализа системы признаков). На практике чаще всего применяется комбинация этих двух подходов, а именно: классификации объектов всегда в той иди иной форме предшествует «предклассификация», т. е. анализ сис- темы признаков. Необходимость анализа признаков связана с тем, что в реальных условиях непосредственно наблюдаемые признаки обычно лишь косвенно отражают существо явления: врач о болезни судит по ее внешним проявлениям, учитель или психолог об одаренно- сти ученика — на основе тестов, экономист об эффективности работы предприятия — по системе показателей и т. д. Многие признаки заве- домо взаимосвязаны и отражают один и тот же аспект характеристики явления. В таких условиях возникает необходимость как-то «переупа- ковать» исходную информацию в соответствии с конечной целью ис- следования, т. е. сгруппировать признаки таким образом, чтобы их группы в наибольшей степени отражали «образ» исследуемого явления или его отдельные аспекты. Выявленными информативными группами признаков или представляющими эти группы синтетическими пере- менными можно пользоваться как критерием при классификации объектов. Факторный анализ предоставляет исследователю адекватный ин- струмент анализа системы признаков. Исследование системы призна- ков, проведенное по одной из моделей факторного анализа, в ряде случаев позволяет вскрыть логическую структуру сложного явления, отделить взаимозависимые и взаимозаменяемые признаки от незави- симых, существенные от несущественных, обосновать выбор той или иной системы признаков, оценить ее информативность, проверить или выдвинуть гипотезы о взаимосвязях в рассматриваемой сложной 6
системе признаков. При классификации объектов факторный анализ применяется на первом, вспомогательном этапе разработки классифи- кационной схемы. Современные алгоритмы автоматической классификации, разрабо- танные в рамках исследований по распознаванию образов, позво- ляют осуществлять классификацию объектов непосредственно в мно- гомерном признаковом пространстве, не прибегая к предварительной группировке признаков. Однако схемы такой непосредственной мно- гомерной машинной классификации часто труднее поддаются интер- претации, чем схемы классификации на основе небольшого числа син- тетических факторов, выявленных с помощью факторного анализа. В частности, затрудняется использование графических методов ана- лиза и интерпретации результатов. В силу своей адекватности челове- ческому восприятию факторный анализ сохраняет свои позиции в ряду новейших методов решения классификационных задач. Интерес к приложению факторного анализа послужил стимулом для его разработки математиками. Появился ряд новых модификаций факторного анализа, разработаны машинные программы, исследуется проблема статистических критериев для оценки надежности результа- тов. Для исследования информационных массивов большой размер- ности советскими математиками предложен так называемый структур- ный, или лингвистический, подход, являющийся комбинацией и раз- витием моделей факторного анализа и автоматической классификации [227], впервые дана точная формулировка и решение задачи группи- ровки параметров [232], предложен ряд эвристических алгоритмов группировки параметров. Одновременно растет разнообразие содержательных постановок за- дач с приложением факторного анализа. Так, помимо «классической» для факторного анализа задачи минимизации описания путем кон- струирования новых обобщающих параметров-факторов, широкое рас- пространение, главным образом в экономико-географических исследо- ваниях, получили пространственно-временные сопоставления. Сопос- тавление осуществляется на базе факторных структур, рассчитанных для нескольких однотипных явлений, или для нескольких периодов в развитии одного и того же явления. Большой интерес представляет применение факторного анализа для разработки типологии отношений, или для анализа диад. В отличие от традиционной постановки задачи матрица исходных данных в этом случае содержит не скалярные, а векторные величины, т. е. характе- ризует не только уровень проявления рассматриваемых признаков, но и их направление. Такие величины могут описывать, например, различного рода экономические взаимосвязи между каждой парой из определенного множества городов, предприятий, отраслей и т. д. Предложены методы использования факторного анализа для исследо- вания динамики явлений. Одним из интересных примеров расширения -_феры применения факторного анализа путем распространения его на анализ качествен- ных данных является создание факторного анализа соответствий. 7
Этот метод предназначен для изучения взаимосвязей между качествен- ными признаками, описывающими некоторую изучаемую совокуп- ность. Например, лица, занятые в обрабатывающей промышленности, могут характеризоваться двумя качественными признаками: отраслью производства, в которой они работают, и наряду с этим — городом, где они проживают. Можно составить таблицу с двумя входами, в ко- торой на пересечении столбца, соответствующего отрасли, и строки, соответствующей городу, будет стоять число лиц, которые живут в та- ком-то городе и заняты в такой-то отрасли. По этой таблице можно изучать сходство и различия изучаемой группы городов с точки зре- ния структуры их промышленности (поскольку строки таблицы пред- ставляют структуру промышленности рассматриваемых городов). Фак- торный анализ соответствий дает возможность преобразовать эту таблицу, представить города точками в многомерном пространстве, в котором оси переменных соответствуют отраслям. Тем самым исход- ная задача переформулируется в задачу факторного анализа: задан массив числовых данных, характеризующих изучаемую группу объек- тов (городов) по набору переменных (отраслей). Далее составляют матрицу корреляций этих переменных, которую исследуют методами факторного анализа. Интерпретация основных факторов выявляет те группы отраслей, которые определяют различия между обнаружен- ными типами городов1. Несмотря на возросший интерес к факторному анализу, литерату- ра на русском языке, посвященная этому методу, все еще очень бедна. Правда, в 1972 г. вышел в свет перевод фундаментальной ра- боты Г. Хармана [234], в которой с достаточной полнотой представле- ны все основные концепции, история развития и методы факторного анализа. Однако эта работа, как и ранее вышедшая книга, посвященная в основном лишь одной частной модели факторного анализа [231], ад- ресованы в первую очередь математикам и малодоступны исследо- вателям-йприкладникам», не имеющим специальной математической подготовки. Предлагаемая вниманию читателя книга польского ученого Яна Окуня в известной мере восполняет имеющийся пробел. Она рас- считана на первоначальное ознакомление с основами метода, с его возможностями и ограничениями. Автор стремится довести до чи- тателя основные идеи факторного анализа, познакомить его с важ- нейшими этапами расчетной процедуры, обратить его внимание на наиболее сложные проблемы применения факторных методов. Рассматривается ряд вопросов, непосредственно связанных с прило- жением факторного анализа к исследованию содержательных задач, в частности, вопрос о влиянии возможных искажений исходной информации на результаты расчетов, а также вопросы, связанные с организацией факторного эксперимента, проблема мотивации при реализации теста и т. д. Эти вопросы, как правило, мало освеша- * Статья французского математика Ж--П. Балладура, знакомящая чита- теля с основами факторного анализа соответствий, приводится в приложении 8
ются в математических работах по факторному анализу. Для ил- люстрации автор ссылается на задачи по обработке психологических тестов, однако изложение по существу не привязано к психологии, поэтому книга может быть полезна исследователям в различных областях знаний. Книга Я- Окуня поможет заинтересованному чи- тателю ориентироваться в моделях факторного анализа, подготовит его к чтению более фундаментальных современных исследований. При переводе книги, стремясь к унификации русской терминоло- гии по факторному анализу, мы придерживались той передачи терми- нов, которая была принята при переводе работы Г. Хармана [2341. Это относится прежде всего к такому труднопереводимому термину, как общность (communality), определяющему факторную дисперсию, т. е. ту часть полной дисперсии переменной, которая может быть объяс- нена с помощью выделенных факторов. Тот же принцип выдержан при передаче таких терминов, как уравнение тетрады, коэффици- ент надежности, вращение осей, матрица до и после поворота и т. д. В русском переводе книга подверглась некоторому сокращению. В частности, опущено очень подробное описание «ручной» процедуры расчета факторов по методу главных компонент, поскольку сейчас такие расчеты полностью переданы ЭВМ. В то же время в ряде других разделов описание расчетной процедуры сохранено, ибо по замыслу автора подробный показ техники расчетов на числовых примерах должен помочь неискушенному в математике читателю про- следить основные зависимости факторного анализа. При чтении книги Яна Окуня следует учесть, что за время, про- шедшее с момента ее издания в Польше, появились новые методы расчетов и новые варианты постановки задач факторного анализа. Ознакомиться с некоторыми из этих новшеств читатель сможет по работам [227—229, 232, 235, 241]. В этих работах читатель най- дет описание машинных алгоритмов факторного анализа и близких ему методов, а также реализующие их программы для ЭВМ на языке АЛГОЛ-60 и АЛМИР [235, 241]. Кроме того, к русскому переводу дано приложение — описание одного из таких вновь раз- работанных методов: факторного анализа соответствий. ' Библиография к польскому изданию охватывает период только до начала 50-х годов. Для ознакомления с более современной ли- тературой по предмету мы отсылаем читателя к библиографическому обзору, опубликованному в работе [234]. В «Дополнение к списку литературы» включены работы по теории и приложению факторного анализа, изданные на русском языке в последние годы. В. М. Жуковская
ВВЕДЕНИЕ С начала нашего столетия весьма интенсивно развивается особая область статистических исследований, называемая факторным ана- лизом. Развитие этого направления математической статистики на- чалось в психологии и по инициативе психологов. Относительно быстро применение факторного анализа распространилось и на другие науки, такие, как социология, педагогика, экономика, биология, медицина, антропология, а в последнее время даже на некоторые области физики, такие, как метеорология и электроника. Все это, однако, совершенно новые сферы приложения факторного анализа. Можно сказать, что до сих пор львиная доля работ с применением факторных методов от- носится к психологии. Число исследований в этой области быстро растет и в настоящее время составляет не одну сотню. Ознакомление со всеми этими работами представляет собой трудноразрешимую проб- лему. Авторами основных концепций факторного анализа являются главным образом американские и английские ученые (Ч. Спирмэн, Л. Л. Тэрстоун, Г. X. Томсон, С. Л. Барт, Р. Б. Кеттелл и многие другие). Постепенно растет интерес к этим методам и в странах кон- тинентальной Европы. В настоящее время в литературе по этому пред- мету уже можно встретить работы немецких, французских, итальян- ских, швейцарских, испанских и других ученых, хотя число этих исследований все еще мало в сравнении с заделом, созданным в англо- саксонских странах. По мнению многих известных исследователей, работающих в об- ласти факторного анализа, значение факторных методов, прежде всего для психологии, социологии и биологии, станет со временем еще более важным. В соответствии с этими прогнозами концепции и методы факторного анализа будут совершенствоваться с учетом полученных результатов. По словам Рэймонда Б. Кеттелла, одного из основных представителей современной американской школы фактор- ного анализа, в настоящее время нет ни одной области психологии, в которой можно стать специалистом, не имея хотя бы общего представле- ния о факторном анализе. Не вдаваясь в обсуждение правомерности 10
такого суждения, можно тем не менее отметить, что всякие попытки критической оценки факторных методов требуют прежде всего глу- бокого ознакомления с их содержанием и результатами использо- вания. Именно такой подход служил импульсом для написания этой книги, задуманной как первая, вступительная статья на пути озна- комления психологов с этой малоизвестной в Польше областью ста- тистических исследований. Факторный анализ—это дисциплина, появившаяся не в последние годы. Начало ее развития датируется 1904 г., когда Чарльз Спирмэн опубликовал свою первую работу по этому предмету [174]. Сильным толчком к развитию факторного анализа было появление новых кон- цепций Л. Л. Тэрстоуна в период между двумя мировыми войнами. Уже тогда существенно расширились как теоретические основы ме- тода, так и возможности его практического использования. Таким образом, хотя факторный анализ относительно молодое направление, следует учитывать, что он получил развитие еще до второй мировой войны. Однако целый ряд обстоятельств затруднял внедрение методов факторного анализа в практику научных исследований в межвоенный период. Вероятно, это объяснялось недостаточной математической подготовкой психологов; были и другие причины, обусловившие такое положение вещей. Необходимо подчеркнуть, что даже примене- ние элементарной статистики в психологических исследованиях в до- военных курсах психологии рассматривалось весьма поверхностно. Студент-психолог получал весьма скромную информацию о расчете корреляций и процентилей почти без какого-либо разъяснения теоре- тических основ. В этих условиях трудно было критически и со всей ответственностью применять методы факторного анализа. В области применения статистики в психологии преобладало самообразование, некоторые успехи в этом направлении были достигнуты только психологами-практиками, занимавшимися подбором и профессио- нальной ориентацией работников. В первые годы после второй мировой войны также не было усло- вий для того, чтобы исправить положение в данной области: до неко- торой степени необоснованная критика статистических методов в пси- хологии, исходящая из опасения перед формализмом и крайней «фе- тишизацией цифр», а также изолированность от центров мировой науки не способствовали этому. В результате большинство польских психологов было слабо под- готовлено для применения даже элементарных статистических мето- дов, не говоря уже о таких тонких и специальных инструментах, как факторный анализ. Уровень математического образования психоло- гов чрезвычайно низок. Если учесть еще одно обстоятельство, которое подчеркивают даже некоторые известные американские и английские авторы и которое заключается в том, что людей, объединяющих в себе способности и интерес к психологии со способностями к математической статистике, очень мало, то становятся понятными трудности, с кото- рыми сталкиваются попытки наших психологов более глубоко изучить методы факторного анализа. Представляется, что главная трудность, 11
с которой я столкнулся как автор данной книги, — определить, как в наших условиях следовало бы излагать методы факторного ана- лиза. Полное уяснение теоретических основ факторного анализа требу- ет широкого использования и математических основ. И хотя для этого вполне достаточно самых элементарных знаний математической статистики (прежде всего анализа корреляции), аналитической гео- метрии и теории определителей, такой путь изложения материала был бы связан с большим риском. Если в настоящее время у нас нет воз- можностей для необходимого углубления математических знаний, остаются в принципе два пути. Один из них более легкий и сводится к чисто формальному описанию применяемых методов и вычислитель- ных операций, без их обоснования и объяснения. Второй—более труд- ный, так как он связан с необходимостью ограничиться некоторыми самыми общими положениями, не нуждающимися в привлечении сложных математических методов доказательств, но зато требующими такого изложения, чтобы читатель получил общее представление, ко- торое облегчит ему дальнейшую проработку предмета. Первый путь представляется очень опасным. Формальное изло- жение методов факторного анализа, как бы «вслепую», влечет за собой большой риск из-за того, что в случае самостоятельных попыток применения какого-либо метода на практике читатель может совер- шить серьезные ошибки; понять значение этих ошибок или избежать их он будет не в состоянии. Методы факторного анализа нельзя применять механически. Поэтому был выбран второй путь, хотя автор и осознавал связанные с ним трудности. Если уже зашла речь о спо- собе изложения материала, то необходимо затронуть еще одну пробле- му. Концепции факторного анализа могут быть описаны в различной последовательности. Можно прибегнуть к исторической последова- тельности. Тогда изложение традиционно начинается с основополо- гающих достижений Ч. Спирмэна, затем прослеживаются последова- тельные фазы развития и борьбы различных точек зрения, после чего дается контур всего направления в том виде, в каком оно существует в настоящее время. Можно пойти в обратном направлений: начать С изложения общей конструкции метода на его сегодняшнем уровне развития и лишь там, где это необходимо, отступать назад, возвращаясь к тем истори- ческим событиям, с которыми логически связан излагаемый материал. Мы выбрали второй способ, поскольку с его помощью можно быст- рее и проще представить все направление, прежде всего потому, что историческое развитие факторного анализа шло довольно извилистым путем. Глубокий смысл первой концепции Спирмэна и ее отношение к последующим достижениям стали понятны лишь на более поздних этапах развития. В последнее время выяснилось также, что различ- ные методы, которые считались противоположными и соперничающи- ми, во многих случаях равноценны. IE Приняв во внимание все эти соображения, мы начинаем книгу с характеристики значения, которое имеет факторный анализ среди 12
научных методов. В следующей главе приводятся некоторые понятия и математические зависимости, непосредственно связанные с пробле- мами .факторного анализа. После изложения элементов теории факто- ров на конкретном примере демонстрируется использование одного из основных методов факторного анализа для иллюстрации главных понятий и концепций. Последние главы посвящены двум наиболее важным проблемам факторного анализа и содержат, в частности, об- зор основных методов определения факторных нагрузок. Здесь также дается в сжатом виде обзор литературы, который, однако, позволяет получить относительно полное представление о направлениях веду- щихся в настоящее время исследований. Подытоживая сказанное, следует подчеркнуть, что данная работа ставит перед собой скромную, но в то же самое время нелегкую зада- чу — первое ознакомление со специальной областью исследований, которая может иметь существенное значение для развития методов научного исследования, прежде всего в психологии. Если после проч- тения книги найдется хотя бы небольшая группа специалистов, у ко- торых возникнет желание изучить литературные источники и провести первые опыты практического использования методов факторного анализа, можно считать, что труд, вложенный в эту книгу, не был напрасным.
Глава первая ОБЩАЯ ХАРАКТЕРИСТИКА ФАКТОРНОГО АНАЛИЗА КАК НАУЧНОГО МЕТОДА Предпринимая попытку изложения основ факторного анализа, можно в принципе ограничиться несколькими вступительными замеча- ниями, относящимися лишь к самым общим положениям этого метода. Так и поступает большинство авторов пособий по этой дисциплине: они исходят из того, что факторный анализ в общем хорошо известен. Во введении к пособиям такого рода можно найти, как правило, ут- верждение, что речь идет об определенном методе анализа вариации признаков, точнее говоря, о ковариации различных психологических, социологических, экономических и других переменных, т. е. о методе, который приводит к выделению определенного числа основных фак- торов, лежащих в основе рассчитанных корреляций. Выделение таких основных, фундаментальных влияний, или факторов, позволяет про- должить исследования взаимосвязей признаков и тех закономерно- стей, которым они подчиняются. Можно полагать, однако, что такой подход к изложению фактор- ного анализа оправдан лишь там, где метод и его различные аспекты известны кругу специалистов. Имея в виду более широкий круг чита- телей, целесообразно было бы расширить рамки вступительных за- мечаний о характере факторного анализа как метода исследования и о его месте среди других научных методов. Решить такую задачу, однако, нелегко, особенно потому, что проблемы факторного анализа представляют для Польши своего рода новинку. Поскольку эти проб- лемы не обсуждались здесь ни психологами, ни методологами, ни за- интересованными специалистами в области математической статистики, еще не сформировалась какая-либо единая обоснованная точка зрения. В этих условиях целесообразно изложение взглядов некото- 14
рых известных авторов, специалистов в области факторного анализа и трактовка этого материала как основы для возможной дискуссии и критических замечаний. Такой солидный вступительный материал теоретического характера можно найти, например, в основополагаю- щем труде создателя многофакторного анализа Л. Тэрстоуна «Mul- tiple-factor analysis» [203]. Из других работ можно указать [56], которая включает обширный материал методологического характера. Исходя из приведенных соображений, будут изложены прежде всего взгляды этих двух авторов, причем мы ограничимся базисными поло- жениями. Представляется, что сравнение их взглядов, а также изло- жение скромных попыток автора дать там, где это возможно, собствен- ное толкование определенных проблем позволит читателю составить некоторое представление об основных положениях факторного ана- лиза, по крайней мере, в той степени, в какой это необходимо для более глубокого ознакомления с технической стороной метода. В разделе о задачах факторного анализа Л. Тэрстоун подчеркива- ет, что исследования в этой области стимулируются надеждой, что те или иные явления, подлежащие изучению, не так уж хаотичны, как иногда может показаться. Факторные методы на первых этапах развития разрабатывались и углублялись в целях определения основ- ных свойств или «показателей» интеллекта. Это можно было бы на- звать поиском основных видов умственных способностей. Однако вскоре оказалось, что методы факторного анализа имеют более об- щий характер. Они нашли применение не только при решении дру- гих психологических проблем, но и вошли в арсенал многих наук. В настоящее время сложились предпосылки, позволяющие считать факторный анализ научным методом, имеющим общий характер. Связь факторного анализа с изучением индивидуальных разли- чий в психологии возникла потому, что использование этого метода возможно лишь там, где существуют переменные величины. Если представить себе изучаемую группу людей, которые все одинаково точны или неточны, например с точки зрения координации глаза и руки, то в этом случае можно утверждать, что для исследования та- кого явления нельзя использовать факторные методы. Только тогда, когда удастся уловить индивидуальные различия между людьми, т. е. вариацию изучаемого явления, можно применять факторный анализ для определения процессов, лежащих в основе эксперимен- тально обнаруженных изменений. Следовательно, определение ин- дивидуальных различий необходимо на первом этапе исследования. Конечной же целью исследования является вскрытие закономерно- стей, объясняющих эти различия. Приступая к изучению какой-то области явлений на основе ана- лиза их вариации, можно идти двояким путем. Можно выдвинуть гипотезу, касающуюся фундаментальных причин указанной вариации, и для ее проверки прибегнуть к факторному анализу либо к более непосредственному лабораторному эксперименту. Можно действовать иначе: отказаться от всяких гипотез и ограничиться сбором макси- мально возможного количества точных данных из интересующей нас 15
области вариации явлений и лишь затем использовать факторный анализ применительно к совокупности таких наблюдений. В этом слу- чае исходят из предположения, что методы факторного анализа поз- воляют обнаружить природу скрытых закономерностей. Наиболее плодотворно использование факторного анализа на ранних стадиях исследования и в тех областях, где лишь начинается научный поиск, где еще не окончательно сформулированы законы и основные концепции, а также там, где трудно проводить эксперименты для оценки предложенных гипотез. Роль факторного анализа довольно скромна: он может помочь определить первые приближенные харак- теристики закономерностей, лежащих в основе явления, и сфор- мулировать первые, самые общие заключения о направлениях, в ко- торых нужно вести дальнейшие непосредственные экспериментальные исследования. Такая трактовка основной функции факторного анализа выражена в часто цитируемом довольно смелом высказывании Тэрс- тоуна: «Факторный анализ особенно полезен в пограничных областях науки». Что представляет собой тот «порядок» или та «структура», которая лежит в основе вариации изучаемой области явлений и которая отыс- кивается при помощи факторных методов? Это попросту система определенных влияний, параметров или факторов, которые определя- ют экспериментально установленную корреляцию. О природе этих факторов не делается никаких априорных предположений. Они с рав- ным успехом могут иметь общественный или физиологический харак- тер, могут сильно коррелировать между собой или не коррелировать вообще, могут иметь простую или сложную внутреннюю структуру. Например, одни из них могут определяться влиянием внутренней секреции, а другие — опытом и подготовкой; одни могут быть врож- денными, а другие — приобретенными; одни — относительно постоян- ными, а другие — быстроизменяющимися. Основное предположение факторного анализа можно сформулиро- вать следующим образом: явления в определенной области исследо- ваний, несмотря на свою разнородность и изменчивость, могут быть описаны относительно небольшим числом функциональный единиц, параметров или факторов. Эти факторы называются по-разному. Можно встретить такие названия, как «влияния», «причины», «пара- метры», «функциональные единицы», «способности», «основные пока- затели» или «независимые показатели». Использование того или иного термина зависит в большой степени от контекста, в котором гово- рится о факторах, от объема наших знаний об изучаемом предмете, наконец, от наших языковых навыков. Серьезно упростило бы дело допущение, что понимаемые таким образом факторы всегда однородны и несложны. Однако наиболее правдоподобно предположить, что их внутренняя структура сложна и поддается дальнейшему анализу. Попытку изложения существа метода можно предпринять на упро- щенном примере, в котором сложные психологические факторы заме- нены более известными и легко интерпретируемыми. В изложении примера будем следовать за Тэрстоуном. 16
Представим себе, что в экспериментальной группе из нескольких сотен мальчиков одной возрастной категории проводятся 20 различ- ных гимнастических упражнений, выполнение которых оценивается по какой-либо сопоставимой шкале. Имея совокупности такого рода оценок, можно рассчитать все корреляции между двадцатью упраж- нениями с учетом качества их выполнения. В результате получим таблицу, имеющую 20 строк, 20 столбцов и включающую соответст- вующее количество коэффициентов корреляции, причем эта совокуп- ность коэффициентов, количество которых в данном случае равно 1901, характеризует какие-то существующие здесь зависимости. Прав- да, из этой характеристики пока что немного можно извлечь. В част- ности, путем изучения такой таблицы коэффициентов корреляции трудно дойти до скрытой основы, до закономерностей эксперименталь- но обнаруженных связей. Здесь возникает основной вопрос: могут ли приведенные в таблице зависимости объясняться на основе именно таких скрытых закономерностей, которые в общем проще совокуп- ности десятков или сотен коэффициентов корреляции, полученных экспериментальным путем? Сторонники факторного анализа отвечают на этот вопрос утвер- дительно. Вернемся к нашему примеру и допустим, что, например, одно из упражнений требует в основном напряжения правого плеча, другое требует в основном чувства равновесия, а третье — быстроты движений тела. Необходимо при этом учесть, что очень многие упраж- нения, требующие в основном усилий правого плеча, могут в очень незначительной степени требовать чувства равновесия, и наоборот. Точно так же другие упражнения требуют в основном быстроты дви- жений, но не требуют усилий правого плеча и т. д. В этом простом примере может оказаться, что обо всех коэффици- ентах корреляции можно судить по относительно небольшому числу (в данном случае оно равно трем) основных параметров или функцио- нальных единиц, которые могут быть названы: 1) чувством равновесия; 2) усилием правого плеча; 3) быстротой движения тела. Каждое из гимнастических упражнений может требовать для вы- полнения одного, двух или трех функциональных элементов одновре- менно, причем маловероятно, что каждое упражнение потребует ис- пользования всех элементов. Все три функциональных элемента необходимы для выяснения общих зависимостей, существующих во всей совокупности гимнастических упражнений. Факторный анализ представляет собой именно тот метод,, кото- рый позволяет определить эти функциональные единицы на основе корреляции, существующей между отдельными упражнениями. Функ- циональные единицы могут рассматриваться как основные факторы, 1 Поскольку матрица симметрична, значения всех коэффициентов повто- ряются дважды, кроме того, 20 коэффициентов равны единице, так как характе- ризуют корреляцию упражнения (признака) с самим собой. 17
определяющие корреляции оценок в серии упражнений. Человек, обладающий хорошим чувством равновесия, лучше выполнит все упражнения, в которых указанный фактор играет главную роль. Тот, кто не обладает этим чувством, выполнит все эти упражнения плохо. Но это еще не все. При помощи факторных методов можно опре- делять, поддается ли обнаруженная функциональная единица разложе- нию на более простые составные элементы или же она сама представ- ляет собой первичный элемент. Если взять, например, чувство равно- весия, то можно организовать новый эксперимент, в котором изучается совокупность 20 различных упражнений, каждое из которых требует чувства равновесия. После проведения факторного анализа может оказаться, что обнаруженный ранее фактор равновесия распадается на более элементарные единицы. Это могут быть какие-то частные ощущения равновесия, например в плоскости симметрии тела (откло- нения вперед и назад) и в перпендикулярной к ней плоскости (откло- нения в стороны). Таким образом, проводя новые факторные экспери- менты, можно получить новую совокупность более тонких и более эле- ментарных факторов равновесия тела. Такого рода исследования, опирающиеся на факторный анализ и приводящие каждый раз ко все более точным понятиям и тонким различиям, можно проводить до тех пор, пока функциональные еди- ницы трудно выделить в непосредственном эксперименте. Когда это становится возможным, факторный анализ уступает место более точ- ным инструментам чисто экспериментальных исследований. Хотя в этом смысле роль факторных методов, по мнению Л. Тэрс- тоуна, наиболее важна на первых этапах исследования, он тем не ме- нее признает, что в определенных случаях эти методы могут использо- ваться также и в давно ведуш'ихся исследованиях, приводя к новой формулировке хорошо изученных проблем. Результаты, полученные с помощью факторного анализа, могли бы также помочь найти новый путь в поисках фундаментальных концепций той или иной отрасли науки. Весьма иинтересны взгляды Л. Тэрстоуна на соотношение фактор- ного анализа и статистических методов. Хотя сегодня эти соображе- ния имеют скорее исторический интерес, представляется, что для создания полной картины целесообразно изложить их в сжатом виде. Говоря о работе К. Холзингера и Г. Хармана [1051, Л. Тэрстоун под- черкивает, что авторы изложили факторный анализ как статистический метод. Сразу же после этого он добавляет: «Это стремление достойно подражания, однако, как и до этого, представители математической статистики не рассматривают факторный анализ как часть статисти- ки». И это еще не все. В другом месте Л. Тэрстоун подчеркивает, что сложившаяся в настоящее время трактовка основных понятий теории статистики не выводит прямым путем к основным теоретическим проблемам факторного анализа. Решение этой проблемы может быть двояким: или теория многофакторного анализа будет приниматься со всеми ограничениями, вытекающими из существующего состояния тео- 18
рии статистики, или удастся склонить статистиков к тому, чтобы они расширили и приспособили свои концепции к проблемам факторного анализа. Можно, очевидно, пытаться решать обе задачи одновременно. Помошь специалистов по математической статистике желательна и не- обходима, однако если они проявят желание сотрудничать в изучении факторного анализа, необходимо прежде всего выяснить определен- ные основные проблемы, что позволит избежать многих последующих недоразумений. Л. Тэрстоун указывает на целый ряд существенных моментов, которые могут стать камнем преткновения. Мы коснемся лишь тех, которые не имеют узко специального характера и не тре- буют глубокого знания математической стороны метода. В факторном анализе широко используется корреляция. Чаще всего применяется обычный коэффициент корреляции смешанного момента Пирсона, в основе которого лежит предположение, что изу- чаемая зависимость имеет линейный характер, т. е. изображается в форме графика с прямыми линиями. Высказываются мнения, что широкое использование этого предположения ничем не обосновано и может приводить к ошибкам, так как изучаемые зависимости часто имеют в действительности не линейный характер, а более сложный вид каких-либо кривых. Л. Тэрстоун подчеркивает, что в факторном анализе, выполняю- щем роль инструмента начальной стадии исследования в новой, ма- лоизвестной области, не так уж важно точное значение коэффици- ентов корреляции или их стандартных ошибок, а гораздо существен- нее общее расположение выявленных факторов. Когда отыскиваются лишь основные черты каких-либо закономерностей, скрытых за не- посредственно доступными наблюдениями изменений, цель исследо- вателя состоит в выработке определенных концепций, для подкрепле- ния которых не нужно кропотливых и детальных расчетов, а доста- точно лишь разумного приближения. У исследователя, рассчитываю- щего на этом этапе сверхточные зачения коэффициентов корреляции, отсутствует чувство юмора, ибо несовершенство его инструментов так не соответствует их кажущейся точности. Вторая проблема такого рода касается очень важных в современной статистике понятий генеральной статистической совокупности и вы- борки из нее. В настоящее время большая часть теории статистики связана с этими концепциями. Основную проблему, которая здесь возникает, можно сформулировать в виде вопроса: в какой мере можно судить о генеральной совокупности на основе сделанной из нее вы- борки? Другими словами: в какой мере выборка репрезентативна для всей совокупности? Теория выборочного метода определяет раз- личные условия, которые должны выполняться для обеспечения репре- зентативности выборки. Одним из таких условий является случайный характер выборки, т. е. такой способ выбора элементов из генераль- ной совокупности, при котором каждый из них имеет одинаковую воз- можность попасть в выборку. Казалось бы, говорит Л. Тэрстоун, что экспериментальная вы- борка, на которую опирается факторный анализ, должна быть репре- 19
зентативна для соответствующей генеральной совокупности. Однако это не так. Когда речь идет об изучении каких-либо закономерностей или структур, лежащих в основе интересующей нас группы явлений, тогда, как и во многих других видах научного поиска, берутся выбор- ки не столь представительные в статистическом смысле, но односто- ронние, часто включающие даже возможно большее количество край- них случаев. Иногда изучаются целые серии таких выборок, взятых с учетом каких-либо интересующих нас в данной области свойств. Такого рода метод исследования с гораздо большей вероятностью может вывести на след скрытых закономерностей, лежащих в основе изучаемых явлений, по сравнению с выборками, для которых характер- но стремление обеспечить случайный отбор из генеральной совокуп- ности. Л. Тэрстоун затрагивает и другие проблемы, вызывающие дискус- сии между представителями факторного анализа и математической статистики. Сюда относится и проблема вращения, которая детально будет обсуждаться в следующих разделах книги. Л. Тэрстоун закан- чивает утверждением, что необходимо прийти к соглашению со стати- стиками по основному пункту проблемы, который кратко можно сфор- мулировать следующим образом: трудные проблемы многофакторного анализа должны не отвергаться, а основательно и объективно изу- чаться. Из того факта, что эти проблемы сложны и вдобавок неудач- но сформулированы, не вытекает, что ими можно пренебрегать. В уже цитированной работе Р. Б. Кеттелл [56] много внимания уделяет вопросам методики. Этот автор не вдается в дискуссию о соот- ношении факторного анализа и математической статистики. Не при- влекая многочисленные источники, он определяет факторный анализ как статистический метод и подробно разбирает вопрос о его месте среди других статистических методов. Приведем несколько важнейших высказываний автора на эту тему. Основные статистические методы служат для упорядочения наблю- дений, для определения средних значений, отклонений от средних, для установления, в какой степени, например, различия средних значений существенны и не случайны и т. д. Эти методы направлены на разграничение вариации, обусловленной интересующими нас причинами, от вариации, обусловленной влиянием, которое мы не можем контролировать. Однако наиболее существенно то, что основные статистические методы, связанные с экспериментом или применяемые к «естественному» материалу наблюдений, таковы, что выбор переменных, которые долж- ны исследоваться с точки зрения их связи с какой-то интересующей нас зависимой переменной, в значительной степени произволен и осу- ществляется, как правило, с помощью какой-либо гипотезы, возник- шей у исследователя. Этот выбор может быть неудачным, а это озна- чает, что выбранные переменные являются неподходящими или только кажущимися показателями того состояния вещей, о котором идет речь. Специальная область статистики, факторный анализ, существенно отличается в этом отношении от основных статистических методов, 20
в особенности от методов, связанных с обработкой экспериментальных данных. Факторный анализ не признает произвольных решений о важности тех или иных переменных для данной области исследова- ний. Более того, он не ограничивается утверждением, что изменение одной переменной связано или не связано с изменением другой, а идет дальше, пытаясь определить меру этой связи. При этом самое главное заключается в том, что он не ограничивается сопоставлением изме- нений, лежащих на поверхности явлений, а стремится обнаружить основные влияния, лежащие в основе этих изменений. Эти основные влияния и есть факторы — в терминологии факторного анализа. Опираясь на наблюдения многих переменных или, точнее говоря, на наблюдения их ковариации, факторный анализ стремится вскрыть ее самые существенные причины, а также их системы или структуры, лежащие в основе разнородных явлений. Благодаря этому факторный анализ в значительно меньшей степени по сравнению с другими мето- дами нуждается в предварительных гипотезах. Приступая к фактор- ному анализу, достаточно иметь общую гипотезу, что в исследуемой области существует какая-то закономерность, какой-то порядок. Более глубокое изучение этих вопросов, как и определение природы факторов, возможно лишь после детального ознакомления с проце- дурой факторного анализа. Сейчас же можно сделать только несколько вводных замечаний об общем характере этого метода. Исследование начинается со сбора наблюдений о варьировании некоторого набора переменных. Это могут быть, например, материалы нескольких сотен тестов, суммирующие результаты опроса достаточно многочисленной группы людей, или какие-либо показатели экономической коньюн- ктуры, взятые за какой-то отрезок времени в рамках более длитель- ного периода, и т. п. Далее рассчитываются все возможные корреля- ции между наблюденными переменными для определения того, су- ществует ли между ними взаимосвязь и какова ее мера. Например, для группы переменных, относящихся к индивидуальным особенно- стям, можно констатировать, что оценки общительности положитель- но связаны с показателями здоровья, тогда как показатели интелли- гентности никак не связаны с этими двумя переменными. Это означа- ет, что интеллигентный человек не обязательно должен быть здоро- вым или общительным. На основе полученных коэффициентов корре- ляции и проводится факторный анализ, показывающий, каким обра- зом некоторые одинаково ведущие себя переменные объединяются в группы. Кроме того, факторный анализ вскрывает основные общие факторы, влияющие на образование этих групп. Если,-например, при изучении многочисленных черт личности выделяется группа переменных, каждая из которых включает элемен- ты быстроты реакции, психической активности и реакции на различные стимулы, то на основе факторного анализа можно установить, что ко- вариация этих переменных вызвана каким-то одним фактором, кото- рый при ближайшем рассмотрении может быть сведен к функциони- рованию щитовидной железы. Этот фактор непосредственно не входил в исследуемый набор переменных, но, несмотря на это, его влияние 21
может быть количественно определено с помощью факторного анализа. Вскрытые факторы сами могут трактоваться как определенные пере- менные, представляющие собой как бы переменные более высокого порядка, которые могут использоваться для объяснения вариации более многочисленных исходных переменных. Благодаря этому, говорит Кеттелл, факторный анализ может иметь значение на ранних этапах научных исследований, когда лишь начина- ют искать законы, направляющие какие-то существенные зависимости. Трудно найти такие законы, пока не определено, на какие перемен- ные следует обратить внимание как на показатели основных влияний, между которыми существуют наиболее сильные закономерные связи. В предельном случае может оказаться, что, выбирая какие-либо пере- менные для изучения связей между ними только на основе собствен- ной интуиции, можно натолкнуться на такие, которые, по существу, являются лишь различными проявлениями одного и того же основного фактора. Метод факторного анализа позволяет вскрыть основные влияния или функциональные единицы, являющиеся относительно независимыми, т. е. те, которые прежде всего должны учитываться при дальнейшем экспериментировании. Мы говорим «относительно независимыми», так как очевидно, что речь не идет о совершенно неза- висимых факторах, поскольку в этом случае эксперименты с целью нахождения взаимосвязей между ними и определения основных зако- номерностей их вариации не имели бы смысла. Основные факторы могут быть лишь функционально независимыми подобно тому, как в физике независимы напряженней сила электрического тока, темпе- ратура и давление газа или как ориентирование в буквах и понимание содержания в процессе чтения. Контролируемый эксперимент, осуществляемый после вступитель- ного анализа основной структуры данной области исследования, бу- дет методически более совершенным по сравнению с эксперимен- том на переменных, выбранных случайно или априорно. Это особенно заметно в психологии, общественных и биологических науках, где обычно существует огромная и на первый взгляд хаотическая масса переменных. Если не предпринимается усилий получить вначале какие- либо данные о внутренней организации или структуре, скрытой как бы под верхним слоем огромного разнообразия явлений, или если прибли- зительно не определено, какие непосредственно доступные переменные выражают собой менее многочисленные, но более существенные влия- ния, лежащие в основе изменений, экспериментальные исследования будут в значительной степени осуществляться вслепую и, несомненно, вызовут большую растрату усилий. Если, например, в психологии труда нас интересует влияние профессиональной среды на личность, то необходимо прежде всего выявить основные составляющие лич- ности, ибо каждая из них может быть подвержена влиянию среды. Если изучается поведение общественных групп в определенных условиях и делается попытка определить, каким образом на результаты труда группы влияют различные системы управления группой, подбор ее состава и т. п., то необходимо прежде всего выявить важнейшие 22
факторы или функциональные единицы, играющие основную роль в поведении общественных групп. Факторный анализ представляет собой эффективный метод выделения таких основных функциональных единиц. Естественно, никто не утверждает, что факторный анализ должен предшествовать всем экспериментальным исследованиям в новой об- ласти разработок. Во многих областях в ряде случаев можно и нужно проводить экспериментальное изучение априорно выделенных пере- менных без определения степени их связи с более существенными факторами. Применение факторного анализа не ограничивается начальными этапами исследования. Являясь довольно гибким количественным методом, он в большей мере, чем другие методы статистики, может применяться для проверки более сложных гипотез. При помощи фактор- ного анализа можно не только проверить, существует ли зависимость, но также и определить ее степень. Факторный анализ позволяет полу- чить информацию о числе факторов в данной ситуации, об их при- роде и взаимосвязи. По наблюдениям о вариации 30—40 различных переменных можно при помощи факторного анализа получить конкретную информацию о том, что в данном случае мы имеем, например, 6 различных факторов, которые коррелируют между собой в той или иной степени и каждый из которых в той или иной степени влияет на изменения соответству- ющих исходных переменных. Этим путем можно проверить гипотезу, выдвинутую по результатам, полученным другими методами. Если попытаться кратко охарактеризовать факторный анализ как статистический метод, то важно упомянуть следующие соображе- ния: 1. Факторный анализ, в противоположность контролируемому эксперименту, опирается в основном на наблюдения над естествен- ным варьированием переменных. 2. При использовании факторного анализа совокупность пере- менных, изучаемых с точки зрения связей между ними, не выбирается произвольно: этот метод позволяет выявить основные факторы, ока- зывающие существенное влияние в данной области. 3. Факторный анализ не требует предварительных гипотез, на- оборот, он сам может служить методом выдвижения гипотез, а также выступать критерием гипотез, опирающихся на данные, полученные другими методами. 4. Факторный анализ не требует априорных предположений от- носительно того, какие переменные независимы, а какие зависимы, он не гипертрофирует причинные связи и решает вопрос об их мере в процессе дальнейших исследований. Благодаря этим свойствам факторный анализ приобрел особое значение в психологии и общественных науках, так как именно в этих областях часто практически не существует возможностей для экспе- риментального контроля отдельных влияний и, несмотря на это, .нужно определить основные переменные, представляющие существен- 23
ные скрытые структуры. Кроме того, может оказаться, что заранее сформулированные гипотезы слабо обоснованы или выводят на лож- ный путь, а причинные связи носят совсем другой характер. В этих случаях факторный анализ, несмотря на присущие ему недостатки и трудности, представляет собой, по мнению Кеттелла, самый лучший из существующих в настоящее время инструментов исследования. Как видно из приведенных высказываний, мы имеем дело со Специ- фическим методом исследования, зародившимся в психологии и опирающимся на математическую статистику. В связи с этим методом возникают различные концепции, которые иногда вызывают упреки со стороны математиков. Напомним уже ранее приводившийся интересный факт, что создатель многофакторного анализа Л. Тэр- стоун возражал против определения факторного анализа как стати- стического метода. Говоря о теоретических основах факторного анали- за, этот автор охотнее пользуется термином теория факторов, как бы подчеркивая отличие этой теории от теории статистики. Не пытаясь решить вопрос о том, насколько обоснованно уже сегодня можно относить факторный анализ к статистическим мето- дам, нужно всегда учитывать факт, наиболее интересный для психоло- гов, что существенным элементом этого метода является в большинстве случаев эксперимент. Не без основания в специальной литературе установился термин факторный эксперимент. Проведение факторного анализа какой-либо психологической проблемы должно начинаться с разработки программы эксперимен- тальных исследований. Если, например, речь идет о способностях, то это будет серия тестов, подобранных в соответствии с основной целью работы и реализованных в определенных условиях примени- тельно к группе обследуемых людей. Результаты исследований дадут совокупность экспериментально рассчитанных корреляций. Лишь с этого момента начинается статистическая обработка данных, полу- ченных в ходе специально разработанного эксперимента. Дать то или иное определение факторного анализа нелегко, учиты- вая все множество нерешенных проблем, связанных с его исполь- зованием. До сих пор не достигнуто полного согласия между пред- ставителями факторного анализа и теории статистики. По многим важным проблемам дискуссия еще продолжается. Многое из того, что сказано о целях и возможностях факторного анализа его видными представителями, можно назвать в определенном смысле «программой максимум». Это в основном общие и многообещающие перспективы, которые откроются перед методом факторного анализа, если его «тех- нико-математическая» сторона действительно позволит обоснованно и однозначно выделить факторы или функциональные единицы, ле- жащие в основе ковариации многих переменных. В действительности же дело обстоит не совсем так: факторный анализ как метод имеет опре- деленные слабые стороны и четко различимые ограниченные возмож- ности. Мы вернемся к этим проблемам в следующих разделах, когда будут обсуждаться отдельные вопросы факторного анализа. Здесь 24
же можно лишь указать, что одна из самых слабых его сторон заключа- ется в отсутствии однозначного математического решения проблемы факторных нагрузок, т. е. вклада отдельных факторов в вариацию различных переменных. Такая ситуация послужила причиной многих дискуссий, как между представителями факторного анализа и мате- матиками,- так и между самими специалистами по факторным методам. Во всяком случае нужно осознать, что, с одной стороны, мы имеем дело с определенной концепцией, которая стремится объяснить най- денные корреляции при помощи общих факторов, параметров или функциональных единиц, а с другой стороны, необходимо учитывать, что возможности достаточно точного и однозначного выделения этих факторов с помощью математики ограниченны. Перейдем теперь к более подробному изложению проблем, свя- занных со способами практического выделения факторов. Для этого необходимо рассмотреть некоторые математические основы фактор- ного анализа.
Глава вторая МАТЕМАТИЧЕСКИЕ ОСНОВЫ ФАКТОРНОГО АНАЛИЗА 1. МАТРИЦЫ И ОПРЕДЕЛИТЕЛИ Прежде чем приступить к обсуждению некоторых основных эле- ментов теории факторного анализа, — это будет сделано в той мере, в какой необходимо для понимания практической процедуры выделе- ния факторов, — необходимо изложить некоторые разделы матема- тики, используемые этой теорией. Для того чтобы освоить факторные методы на уровне, необходимом исследователям-вприкладникам», нужен некоторый объем математи- ческих знаний, которые прежде всего включают элементы, охваты- ваемые программой средней школы. Сюда относятся основные сведе- ния из алгебры и тригонометрии, а*также такие элементы аналити- ческой геометрии, как координаты и векторы на плоскости и в прост- ранстве. Эти вопросы не будут рассматриваться в силу их элементар- ности, а также потому, что по данному предмету существует большая литература, включая школьные учебники. Но это еще не все. Основное значение для теории факторного ана- лиза имеет раздел математики, менее популярный и не входящий в программу общеобразовательных школ. Речь идет о понятии мат- риц и определителей. Эти понятия будут рассмотрены более подробно. Во вступлении к своей основополагающей работе «Многофакторный анализ» Л. Тэрстоун подчеркивает, что трактовка основных положе- ний факторного анализа в терминах матричного исчисления явилась 26
переломным моментом, позволившим развить и обобщить исходные кон- цепции Ч. Спирмэна. Необходимо подчеркнуть, что именно Л. Тэрс- тоун впервые использовал матричную алгебру в факторном анализе. Мы познакомимся более основательно с теми математическими поня- тиями, которые, как правило, мало известны «прикладникам» и в то же время не настолько трудны, как может показаться с первого взгля- да. При этом мы максимально подробно рассмотрим лишь элементы, необходимые для дальнейшего изложения, так как цель данной главы заключается не в углублении и основательном рассмотрении различ- ных понятий и математических проблем, связанных с факторным ана- лизом, а скорее в ознакомлении читателя с терминологией и самым общим характером зависимостей, с которыми чаще всего сталкивают- ся при использовании факторных методов. 1 2 3 1 «11 «12 «13 2 О21 «22 «23 3 о32 а33 4 a^Y «42 «43 Схема 2.1. Квадратная а. МАТРИЦА. ПОРЯДОК И РАНГ МАТРИЦЫ Матрицей называется прямоугольная или квадратная таблица чисел, рассматриваемая безотносительно к тому, что именно представ- ляют собой эти числа и существуют ли между ними какие-то заранее определенные зависимости. Вертикальный ряд чисел, расположенных в матрице одно над другим, называется столбцом, горизонтальный ряд чисел — строкой. Матрица, в которой число строк равно числу столб- цов, называется квадратной. В тех случаях, когда нужно обозначить какие-либо элементы матрицы, им приписываются соответствующие индексы, первый из которых указывает номер строки, а второй — но- мер столбца, в котором находится данный элемент. 4 «и «24 24 = А ам итрица 4X4 Таким образом, в квадратной матрице, показанной на схеме. 2.1, символ а23 обозначает элемент, находящийся на пересечении второй строки и третьего столбца. Вся матрица обозначается буквой А. С обе- их сторон матрица ограничивается двумя вертикальными линиями. Это помогает отличить ее от определителя. Некоторые авторы исполь- зуют для этого обычные квадратные или фигурные скобки. О матри- це, имеющей т строк и п столбцов, говорят, что ее порядок составляет т х п. Квадратная матрица п х п имеет порядок п. В общем виде 27
матрица записывается следующим образом: °-11 ®12 ^13 а1п а21 °22 ®23 ••• а2п ................ аи ^rnl &т2 @тЗ ••• @тп Схема 2.2. Общая запись матрицы В первой строке этой матрицы находятся элементы аи, а12, а13, а1п, что означает лишь то, что матрица содержит п столбцов. Если еще раз взглянуть на элементы первого столбца ди, а21, ..., ат1, .то можно убедиться, что матрица включает т строк. Общий элемент матрицы записывается в виде aijt где i (индекс строки) может прини- мать последовательные значения I, 2, 3, т, a j (индекс столбца) может принимать последовательные значения 1, 2, 3, п. Матрица А может обозначаться через ее общий элемент ||агД. б. ТРАНСПОНИРОВАНИЕ МАТРИЦЫ Это важное понятие, часто встречающееся в факторном анализе. Представим себе, что строки матрицы А становятся столбцами, в ре- зультате чего возникает новая матрица, которая будет транспониро- ванной по отношению к А. Обозначим новую матрицу А'. Дадим при- мер транспонирования матрицы 3 2 6 8 2 0 5 6 4 0 3 6 А 3 2 4 2 0 0 6 5 3 8 6 6 А' Схема 2.3. в. СИММЕТРИЧЕСКАЯ МАТРИЦА Если матрица А квадратная и совпадает с транспонированной к ней матрицей, то матрица А симметрична. Другими словами, квад- ратная матрица А симметрична, если А' -= А. Пример симметриче- ской матрицы дает схема 2.4. 5 6 8 3 5 4 = Д = Д' Схема 2.4. Симметрическая матрица 28
Если элементами матрицы являются коэффициенты корреляции данной совокупности переменных, то эта матрица симметрическая. В факторном анализе, как правило, встречаются именно такие ситуа- ции. г. УМНОЖЕНИЕ МАТРИЦ Матрицы можно умножить друг на друга. Операция умножения часто встречается в факторном анализе и поэтому мы обсудим ее под- робнее. Не вдаваясь глубоко в теорию вопроса, ограничимся описанием практических правил умножения матриц. Правила эти гораздо сложнее правил умножения в арифметике. Первое отличие между умножением в арифметике и в матричной ал- гебре состоит в том, что при умножении матриц не действует закон коммутативности, в соответствии с которым произведение не зависит от порядка, в котором стоят сомножители. Если умножаются мат- рицы, их произведение в общем случае зависит от этого порядка. Другими словами, АВ #= ВА. Для умножения матрицы А на матрицу В необходимо выполнение следующего условия: матрица А должна иметь столько столбцов, сколько строк в матрице В. Сам процесс умножения исходит из пра- вила «строка на столбец». Это правило означает, что каждый элемент матрицы-произведения представляет собой сумму произведений от ум- ножения элементов строки первой матрицы на соответствующие элементы столбца второй матрицы. Процесс умножения иллюстри- рует схема. 2.5. 1 2 3 4 (йи ЬцА-а12 Ь21) (°21 ^11 + ^22 ^21) (а31 ^11 + °32 ^21) (а41 6ц4-о42 й21) («и Ь12 + а12 Ь22) (a2j b12 -f- а22 Ь22) (°31 ^12 4“ °32 ^22) (а41 Ь12 + а42 Ь22) С (О11 ^13 4" °12 ^2з) (й21 ^13 4" а22 ^2з) («31 ^13 4“ «32 ^2з) («41 ^13 4* «42 ^2з) Схема 2.5. Умножение матриц Таким образом, элемент, стоящий на пересечении второй строки и третьего столбца матрицы С, образуется путем последовательного умножения элементов второй строки матрицы А (в нашем случае элементов а21 и а22) на соответствующие элементы третьего столбца матрицы В (Ь13 и Ь2з) и суммирования произведений. В приведенном примере каждый элемент матрицы-произведения представляет собой 29
сумму двух произведений. Если бы матрица А имела 3 столбца, а мат- рица В — три строки, то каждый элемент матрицы-произведения являлся бы суммой трех произведений. Матрица, представляющая собой произведение двух матриц, будет иметь всегда столько строк, сколько их было в первой матрице, и столько столбцов, сколько их было во второй матрице. Если матри- ца порядка (р х q) умножается на матрицу порядка (q х г}, то их произведение будет иметь порядок (р х г). д. ВИДЫ МАТРИЦ, ЧАЩЕ ВСЕГО ВСТРЕЧАЮЩИЕСЯ В ФАКТОРНОМ АНАЛИЗЕ Диагональная матрица. Это квадратная матрица, в которой отличны от нуля только элементы, лежащие на главной диагонали. Главной диагональю называется линия, связывающая левый верхний угол с правым нижним углом матрицы. Диагональная матрица имеет такой вид: а О О О О b О О О 0 с О О 0 0 d Скалярная матрица. Если все элементы диагональной матрицы равны между собой, то такая матрица называется скалярной. Скалярная матрица имеет следующий вид: а О О О О о О О О О а О О 6 0 а Единичная матрица. Это диагональная матрица, у ко- торой все элементы главной диагонали равны единице. Единичная матрица четвертого порядка выглядит так: 10 0 0 0.1 0 0 0 0 10 0 0 0 1 Единичная матрица обозначается символом I. Интересно отметить следующую особенность единичной матрицы: если квадратную матрицу А умножить на единичную матрицу I того же порядка, что и матрица А, то получим матрицу А, независимо от того, в каком порядке стоят сомножители. Таким образом. Al = IA = А. 30
Единичная матрица выполняет в матричной алгебре ту же роль, что и единица в арифметике. Обратная матрица. Выше уже была рассмотрена опе- рация умножения матриц. В матричном исчислении существует опе- рация, соответствующая делению в арифметике. Всем известна прос- тая зависимость, которую можно представить в виде: %- — =1. X Эта зависимость означает, что произведение любого числа на об- ратное ему число равно единице. В матричной алгебре сущест- вует такая же связь. Если матрица А квадратная и невырожденная1, то существует такая матрица, обозначаемая символом А-1 и называе- мая обратной к матрице А, что А-А-1^!. (2.1) .Матрица Л-1 в определенном смысле аналогична обратному числу в арифметике, однако способ вычисления обратной матрицы довольно сложен. Можно найти и другие аналоги с арифметикой. Известно, что при переносе какого-либо сомножителя с одной стороны уравнения на другую он становится обратной величиной: а-Ь = с, Ь = — -с. а Имея дело с матрицей, являющейся сомножителем, нужно посту- пать аналогично. Такая матрица, перенесенная на другую сторону уравнения, будет иметь вид обратной матрицы: л.в=с, в = л-1-с. Необходимо подчеркнуть, что если матрица А стояла слева от В, то обратная матрица Л-1 должна также стоять слева от матрицы С. Поэтому было бы неправильно писать В = СА-1. е. ОПРЕДЕЛИТЕЛИ Излагая некоторые наиболее общие положения теории определи- телей, мы ограничимся теми элементами, которые чаще всего встре- чаются в практике факторного анализа. Какова разница между опре- делителем и матрицей? Определитель — это некоторое числовое значение, характеризую- щее рассматриваемую квадратную матрицу. Таким образом, каждой квадратной матрице сопоставляется некоторое числовое значение, вычисляемое по определенным правилам. 1 Вырожденная матрица — это квадратная матрица, определитель которой равен нулю. Невырожденная матрица имеет определитель, не равный нулю. 31
Если квадратная матрица обозначается символом А, то ее опреде- литель — символом | А |. Определитель матрицы /г X п имеет порядок п. Если определитель записывается в форме таблицы, то в отличие от матрицы по его обеим сторонам будет находиться по одной верти- кальной линии. Определитель второго порядка будет иметь следующий вид: «11 П1а «21 «22 Вычислять определители высоких порядков сложно. Поэтому мы ограничимся простым примером вычисления приведенного определите- ля второго порядка. Значение определителя рассчитывается по фор- муле ОцПц «21«12* Легко видеть, что если имеет место равенство «11«22— «21«12> то определитель равен нулю. В этом случае говорят, что определитель обращается в нуль. Напомним еще одно понятие, связанное с определителями и исполь- зуемое в факторном анализе. Если у данного определителя вычерк- нуть одно и то же число столбцов и строк, то мы получим минор. Возьмем, к примеру, определитель третьего порядка «11 «12 «13 «21 «22 «23 «31 «32 «33 Из этого определителя можно получить некоторое число миноров второго порядка, если вычеркивать по одной строке и одному столб- цу. Легко видеть, что таких миноров будет 9, так как определитель содержит 9 элементов, из которых каждый может стоять на пересече- нии вычеркиваемой строки и столбца. Так, если мы вычеркнем третий столбец и третью строку, пересе- кающиеся в том месте, где стоит элемент а33, то получим минор «11 «12 «21 «22 Если вычеркивается первая строка и второй столбец, пересекающиеся там, где стоит элемент а12, то получается минор «21 «31 «23 «33 и т. д. Если из определителя третьего порядка вычеркнуть какие-либо два столбца и две строки, то минор будет состоять только из одного элемента. В этом смысле каждый элемент определителя можно рас- сматривать как минор. 32
ж. РАНГ МАТРИЦЫ В заключение рассмотрим еще проблему ранга матрицы. Для уяснения этого важного для факторного анализа понятия нужно преж- де рассмотреть вопрос линейной зависимости между строками или столбцами матрицы 3 2 1 5 4 7 6 4 2 10 8 14 9 6 3 15 12 21 12 8 4 20 16 28' И. Схема 2.6. Матрица, в которой строки и столбцы линейно зависимы Пусть дана матрица 4x6, изображенная на схеме 2.6. При ее внимательном рассмотрении видно, что вторую строку можно полу- чить, умножив каждый элемент первой строки на 2. Третья строка получается путем умножения каждого элемента первой строки на 3, а четвертая — путем умножения каждого элемента первой строки на 4. Необходимо подчеркнуть, что используемые в примере множители могут быть любыми. Наиболее существенно то, что для каждой строки i данной матрицы существует такое число сг, что выполняется ра- венство ац = (2.2) Другими словами, каждая строка нашей матрицы может быть вы- ражена при помощи элементов первой строки и некоторого числа. О каждой такой паре строк, в которых одну строку можно выра- зить при помощи элементов первой строки и некоторой постоянной, говорят, что эти строки линейно зависимы. Легко видеть, что все элементы таких двух строк пропорциональны друг другу. Нетрудно также убедиться, что пропорциональными будут и столбцы матрицы. Возможны случаи, когда строки матрицы могут быть линейно связаны с двумя или более строками. В этом случае также имеет место линейная зависимость. В нашем случае все строки линейно зависят от первой строки матрицы; то же относится и к столбцу. Например, второй столбец образован умножением всех элементов первого столбца на 2/3. Для других столбцов такими числами будут 1/3, 5/3, 4/3, 7/3. Если какие-либо две строки матрицы непропорциональны, т. е. одна из них не может быть выражена через другую с помощью какого- либо числа, то такие строки линейно независимы. Вернемся к понятию ранга матрицы. С учетом вышесказанного ранг матрицы можно определить как максимально возможное число линейно независимых строк (столбцов) матрицы. В нашем примере (схема 2.6) каждая строка может быть выражена при помощи элементов одной строки и некоторых чисел. Поэтому ранг этой матрицы 1. При этом легко видеть, что исчезают, точнее обращаются в нуль, все миноры второго порядка. 2 Зак. 377 33
Если представить себе матрицу, в которой каждая строка может быть линейно выражена через две первые строки, то ранг этой матрицы будет равен 2, так как у нее две линейно независимые строки. Тогда из определителя матрицы исчезают все миноры третьего порядка. Можно также указать, что если ранг матрицы d, то в ней сущест- вует такой набор из d строк или столбцов, что каждая другая строка или столбец матрицы могут линейно выражаться через строки или столбцы набора. Таков подход к рангу матрицы с математической точки зрения. О значении этого понятия в теории факторного анализа мы будем го- ворить ниже. 2. КОРРЕЛЯЦИЯ Элементами исходной 'матрицы в факторном анализе являются коэффициенты корреляции. Вся процедура расчетов начинается с определения коэффициентов корреляции внутри изучаемой сово- купности переменных. Не вдаваясь глубоко в теорию корреляции, составляющей часть математической статистики, мы осветим лишь те вопросы, которые имеют непосредственное отношение к фактор- ному анализу и его расчетной реализации. Поскольку корреляция рассчитывается применительно к перемен- ным, необходимо прежде всего определить, что такое переменная. Переменную можно просто определить следующим образом: это такая величина, которая в ходе данного процесса может изменяться, т. е. принимать различные значения. Например, если под переменной понимать тест, используемый для определенной группы лиц, то он представляет собой переменную в том смысле, что результаты этого теста у отдельных обследованных людей будут изменяться в опреде- ленных границах. Как трактуется зависимость между двумя переменными с помощью корреляции? Прежде всего осуществляется серия наблюдений за дву- мя интересующими нас в данном случае переменными. Это могут быть, например, такие переменные, как рост отцов и сыновей. Затем попы- таемся определить, существует ли какая-нибудь связь между ростом отцов и сыновей. Одной переменной будут различные значения (наб- людения) роста отцов, второй — роста сыновей. Для этого осуществля- ется максимально возможное количество таких наблюдений (в практике оно должно быть не менее 100), в ходе которых накапливаются пары наблюдений: рост отца и рост его сына. При изучении зависимости между двумя переменными необходимо всегда выбирать какие-либо пары наблюдений. Подбор этих пар определяется содержательной постановкой задачи анализа. В приведенном примере мы хотим определить, существует ли зависимость между ростом отцов и сыновей. Следовательно, нужно составить пары наблюдений, составленные из: а) наблюдения роста отца и б) наблюдения роста его сына. В случае, когда изучается связь между ростом и весом, осуществляются наблю- дения над некоторым множеством объектов, причем каждая пара наб- 34
людений относится к одному и тому же объекту. Собрав соответствую- щее количество таких пар наблюдений, можно по определенному ме- тоду рассчитать коэффициент корреляции (коэффициент взаимосвя- зи), величина и алгебраический знак которого показывают, сущест- вует ли связь и если существует, то каковы ее степень и направление. Положительная связь, когда коэффициент корреляции имеет знак плюс, говорит о том, что обе переменные изменяются в одном направле- нии, т. е. чем выше отец, тем выше сын, чем ниже отец, тем, вообще говоря, ниже сын. Отрицательная связь, когда коэффициент корре- ляции имеет знак минус, говорит, что переменные изменяются в проти- воположном направлении. В нашем примере — чем выше отец, тем ниже сын, и наоборот: чем ниже отец, тем выше сын. Нулевое или близкое к нулю значение коэффициента корреляции означает, что обе переменные изменяются независимо друг от друга. Значения коэффи- циента корреляции находятся в границах от —1 до ф-1. Значение + 1 соответствует случаю линейной положительной корреляции, - —1 — линейной отрицательной связи. Оба эти случая редко встреча- ются в практике. Выше уже говорилось, что нулевой коэффициент корреляции означает полное отсутствие взаимосвязи. Значения ко- эффициента корреляции в границах от +1 до —1 соответствуют про- межуточным степеням взаимосвязи переменных. В нашем примере линейная положительная связь существует тогда, когда во всех наблюдениях более высокий отец имеет более высокого сына, и наобо- рот, более низкий отец имеет менее высокого сына. Соответственно этому линейная отрицательная связь существует в том случае, когда во всей совокупности наблюдений более высокому отцу соответствует более низкий сын, и наоборот. * Решающее значение имеет еще одна проблема. Из показателей корреляции чаще всего пользуются коэффициентом корреляции сме- шанного момента Пирсона—Бравэ, обозначаемым буквой г. Не вда- ваясь в теорию корреляции и значение так называемой линии регрес- сии, можно приблизительно считать, что линейная зависимость су- ществует тогда, когда точки, соответствующие на графике значениям переменных, размещаются вдоль прямой линии. Если мы имеем не- линейную связь, которая соответствует на графике какой-либо кри- вой, то нужно использовать специальный коэффициент криволинейной корреляции Пирсона. Этот коэффициент, обычно обозначаемый буквой т), выражает степень действительной связи двух переменных, но тем не менее не используется в факторном анализе, который в силу основ- ного предположения ограничивается линейными зависимостями. Это ограничение имеет первостепенное значение, и о нем нужно всегда помнить. К счастью, многие зависимости между биологическими, психологическими и социологическими переменными имеют почти линейный характер и благодаря этому применительно к ним можно использовать обычный коэффициент корреляции. Существуют раз- личные показатели корреляции (коэффициент корреляции Пирсона— Бравэ, коэффициент ранговой корреляции, коэффициент зависимости Юла и т. д.) и различные модификации применяемых формул. Выбор 2* 35
наиболее подходящего для факторного анализа метода зависит от раз- ных обстоятельств, имеющих более или менее существенный характер. Помимо основных особенностей показателей корреляции имеют значе- ние и такие факторы, как экономия на расчетах. Сточки зрения прос- тоты расчетов весьма удобным является четырехпольный коэффици- ент корреляции <р. Однако при его использовании отсекается область изменения наблюдений в определенной произвольно взятой точке, и поэтому все, что находится выше, принимается за одну, а все, что находится ниже, — за другую категорию. В результате такой коэф- фициент не дает полной информации о зависимости между изучае- мыми переменными. В других случаях один показатель требует больших расчетов по сравнению с другим. Наиболее подходящим для факторного анали- за представляется коэффициент корреляции Пирсона—Бравэ. Он ис- пользуется для непрерывных переменных и больших выборок (N 50). Для упрощения расчетов часто рекомендуется определенная разновидность показателя Пирсона — формула для необработанных оценок. Она имеет следующий вид: — MXY-MX-MY „ _ г " Утих2—(/илу ул1У2—(Л1У)2 ’ ' ' где X и У — необработанные результаты наблюдений двух перемен- Л/fV Л/Г 17 Л f 172 SX2 AS 172 SV2 л f 17X7 них, MX = -jy- , MУ = -ц- , MX2 = -fi- , MY2 = , МХУ = sxy = —др ; N — число наблюдений. Эта формула может иметь также следующий вид: -----{24) |/[Л'ХХ2 —(УХ)2] [Л’ХУ2 — (2У)2| v ' Приведенные формулы Пирсона не требует того, чтобы наблюде- ния выражались в терминах стандартного отклонения. Стандартные отклонения часто используются в статистике. Подробное изложение содержания этой категории не входит в нашу задачу, поэтому мы лишь напомним, что она явится одним из показателей разброса наб- людений вокруг их средней арифметической. Представляется целесообразным использование в каждом иссле- довании какого-либо одного коэффициента корреляции. Помимо уже отмеченного важного условия, что зависимость, вы- раженная коэффициентом корреляции, должна быть линейной, необ- ходимо учитывать некоторые общие обстоятельства, влияющие на зна- чимость коэффициента корреляции. Сюда относятся такие проблемы, как размер и репрезентативность исследуемой выборки по отношению к генеральной совокупности, однородность изучаемой группы с точки зрения каких-либо важных переменных, точность и аккуратность наблюдений и т. д. В случае психологических тестов точность наблю- дений имеет особое значение. Точность, называемая также надеж- 36
ностью, определяется разными методами. Необходимо различать точность как свойство данного инструмента наблюдений и различные способы ее определения. Укажем в этой связи на одну из точек зре- ния по данному вопросу, высказанную в «Технических рекоменда- циях для психологических тестов и диагностических методов», кото- рыми руководствуется Американская психологическая ассоциация. Точность как свойство данного инструмента наблюдений можно в широком смысле определить как степень, в которой этот инстру- мент всегда дает одинаковые наблюдения одной и той же величины. Если речь идет о тестах, то можно говорить о степени устойчивости результатов, полученных при нескольких реализациях одного и того же теста или при параллельных реализациях близких вариантов этого теста. Способы измерения точности разнообразны. Можно указать на следующие часто применяемые показатели: I. Коэффициент корреляции между оценками, полученными в от- стоящих друг от друга на определенный период времени двух после- довательных обследованиях с помощью данного теста одной и той же группы людей. Этот показатель называется коэффициентом стабиль- ности. 2. Коэффициент корреляции между оценками, полученными в двух обследованиях одной и той же группы, проведенных примерно в одно и то же время с помощью двух параллельных форм данного теста. Этот показатель называется коэффициентом эквивалентности. 3. Сначала рассчитываются корреляции между половинами дан- ного теста, а затем используется формула Спирмэна — Брауна: = (2-5) где гг — корреляция между целым тестом и его половиной, или коэф- фициент стабильности, г — корреляция между половинами теста. Этот способ упрощает сбор данных, так как можно получить ин- формацию для расчета точности после одноразового применения дан- ного теста. Некоторые трудности иногда возникают при определении эквивалентных половин теста. На практике применяются различные способы. Например, если тест состоит из большого числа элементов, то определяется корреляция между оценками всех четных и оцен- ками всех нечетных элементов. На этом мы заканчиваем общие рассуждения о корреляции и пере- ходим к более детальному рассмотрению проблем, непосредственно связанных с теорией факторного анализа.
Глава третья НЕКОТОРЫЕ ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕОРИИ ФАКТОРНОГО АНАЛИЗА 1. ИНТЕРПРЕТАЦИЯ КОРРЕЛЯЦИИ Еще раз вернемся к корреляции, но рассмотрим ее теперь в более тесной связи с теоретическими основами факторного анализа. Мы уже знаем, что главной задачей этого метода является опреде- ление основных влияний, т. е. каких-либо функциональных единиц или факторов, лежащих в основе вариации изучаемого явления. Интересно, что именно психологам впервые пришла мысль о необхо- димости определения таких основных относительно независимых факторов. Это случилось в процессе исследований с помощью тестов, когда положительная корреляция большого числа различных тестов, предназначенных для изучения разных видов умственных способ- ностей, привела к гипотезе о том, что большинство из них измеряет, по существу, одно и то же явление. Еще в 1904 г. Чарльз Спирмэн подчеркнул, что можно доказать существование одного фактора, про- являющегося в большинстве тестов умственных способностей. Это было первое конкретное достижение факторного анализа. Однако зачатки категории факторов, определенных как функциональные единицы, можно найти у автора коэффициента корреляции Гальтона и у исследователя свойств этого коэффициента Пирсона. Оба они выдвинули проблему поиска общей причины, вызывающей корреля- цию двух серий наблюдений. В предшествующей главе были даны общие сведения о коэффи- циентах корреляции. В этом разделе будет дано более глубокоеобъяс- 38
нение корреляции между двумя переменными, которое часто встреча- ется у теоретиков факторного анализа. Необходимо отметить, что любая попытка интерпретации корре- ляции и определения ее причины подводит к факторному анализу. Из курса общей статистики известно, что корреляцию между двумя переменными можно интерпретировать в принципе тремя способами. Представим себе, что в определенной группе людей при помощи ряда тестов изучается зависимость между механическими способностями и пространственным воображением. Допустим, что, рассчитав корре- ляцию между результатами двух видов тестов, мы получим г — 0,7. Пытаясь объяснить этот результат, можно утверждать: а) основной причиной хороших результатов в тесте механических способностей является пространственное воображение; б) существует какая-то третья способность или группа способ- ностей, которая определяет результаты как тестов механических способностей, так и тестов пространственного воображения; в) механические способности являются причиной хороших резуль- татов теста пространственного воображения. Попытаемся графически проиллюстрировать три перечисленных случая возможного объяснения полученного коэффициента корре- ляции. Это можно сделать, вычертив, например, пересекающиеся круги, где заштрихованная площадь представляет совокупность общих для обоих тестов элементов, т. е. таких элементов, которые каким- либо образом влияют на обе оценки. Если тест пространственного воображения изображается кругом А, а тест механических способ- ностей— кругом В, то первый случай (а) иллюстрируется рис. 3.1. Этот рисунок наглядно демонстрирует тот факт, что индивидуальные различия в пространственном воображении влияют на индивидуаль- ные различия в механических способностях (все элементы А являются элементами В), но они не являются единственной причиной последних (не все элементы В являются элементами А). Второй случай (б) иллюстрируется рис. 3.2. Заштрихованная пло- щадь показывает влияние какого-то общего фактора на индивиду- альные различия в пространственном воображении и механических способностях. Наконец, последний случай (в), когда индивидуальные различия по механическим способностям являются одной из причин индивиду- альных различий в пространственном воображении, изображен на рис. 3.3. Интересно, что в случае (в) направление причинной связи про- тивоположно случаю (а). Следовательно, сам по себе коэффициент корреляции мало что говорите возможной причинной связи. Если на- ряду с коэффициентами корреляции есть еще какая-либо информа- ция относительно того, какая из вышеприведенных возможностей имеет место в данном случае, то можно определить даже и число общих элементов, влияющих на оценки обоих тестов. Чаще всего такой дополнительной информации, которая позволила бы установить вид зависимости, не существует. Поэтому определяется лишь коррсля- 39
ция и предпринимается попытка определения механизма, который ее обусловливает. Очевидно, что на основе одного коэффициента корре- ляции нельзя глубоко познать явление. Увеличивая набор перемен- ных, а тем самым и разнообразие всевозможных корреляций, можно со все большей точностью определять основные причины изменений, обнаружить факторы, скрытые под поверхностными проявлениями зависимостей. Попытаемся пояснить сказанное на примере. Утверждение, что, например, между тестом чтения и тестом понимания арифметического текста в данной группе из 100 обследуемых лиц существует корре- ляция 0,5, не дает еще оснований для однозначного объяснения этой корреляции. Если, однако, в той же группе обследуемых проводится еще один тест, например тест обычного сложения, и оказывается, что между этим тестом и тестом понимания арифметического текста су- ществует положительная корреляция 0,4, то можно допустить, что причиной является какой-то общий для обоих тестов элемент (напри- мер, какая-то способность к арифметическим вычислениям, какая-то легкость оперирования цифровым материалом и т. д.). Теперь су- щественное значение будет иметь корреляция между тестом чтения и новым тестом сложения. Если она близка к нулю, можно допустить, что положительная корреляция теста чтения и теста сложения с тес- том понимания обусловливается другими, независимыми факторами. Если вновь воспользоваться окружностями для геометрической иллюстрации соотношения тестов, то описанные ситуации можно пред- ставить на рис. 3.4. Корреляцию между тестами чтения и понимания арифметического материала можно представить в виде двух пересе- кающихся окружностей (рис. 3.4, а). Корреляция между тестом по- нимания и тестом простого сложения • иллюстрируется рис. 3.4, б. Отсутствие корреляции между тестом сложения и тестом чтения по- казывает рис. 3.4, в. Взаимосвязь всех трех тестов иллюстрирует рис. 3.4, г. На рис. 3.4 заштрихованные площади, обозначающие Рис. 3.1. А — пространст- венное воображение; В— механические способно- сти. Все элементы А яв- ляются также элемента- ми В (но не все элемен- ты В являются элемен- тами Л) Рпс. 3.3. А—. простран- ственное воображение; В — механические спо- собности. Все элементы В являются элементами А (но не все элементы А являются элементами В) Рис. 3.2. А — простран- ственное воображение; В — механические способ- ности. Некоторые эле- менты А являются неко- торыми элементами В 40
о Тест понимания арифметического материала Тест сложения т-Ор Тест понимания арифме- тического материала Рис. 3.4 корреляцию теста понимания с тестом чтения и тестом сложения, не совпадают и, в соответствии с нашей гипотезой, обусловливаются какими-то независимыми факторами. Картина будет иная, если обнаружится положительная корреля- ция между тестом простого сложения и тестом чтения. Тогда в расчет входят две возможности, иллюстрируемые графически на рис. 3.5. В первом случае (рис. 3.5, а) принимается, что причиной корреляции между всеми тремя тестами является в основном один и тот же фактор, изображенный на рисунке с помощью заштрихованной в клеточку площади. Чтобы рисунок был более понятным, два теста изображены овалами. Наоборот, во втором случае (рис. 3.5, б) предполагается, что основная часть корреляции между всеми тремя тестами зависит Тест понимания арифметического материала 3.5 Тест понимания арифметического материала Рис. 41
скорее от каких-то отдельных факторов. Первый случай подводит к гипотезе о том, что большую часть наблюденной корреляции можно объяснить с помощью одного общего фактора, другой случай наводит на мысль о двух общих факторах. Чтобы определить, какая гипотеза ближе к истине, нужно опреде- лить корреляции с другими тестами. Необходимость увеличения числа переменных и определения всех взаимных корреляций приводит к ситуации, в которой число зависимостей растет так быстро, что появляется необходимость в ка- ких-то методах систематической обработки связей между различными переменными. Именно такие методы дает факторный анализ. Таким образом, главную цель факторного анализа можно определить так же как объяснение обнаруженных корреляций путем извлечения на по- верхность факторов, обусловливающих эти корреляции. Путь, веду- щий к этой цели, проходит через анализ совокупностей коэффициентов корреляции, число которых достаточно для того, чтобы можно было определить факторы с необходимой точностью. 2. НЕКОТОРЫЕ ОСНОВНЫЕ ЗАВИСИМОСТИ И ПОНЯТИЯ МНОГОФАКТОРНОГО АНАЛИЗА а. ОДНО ИЗ ГЛАВНЫХ ПРЕДПОЛОЖЕНИЙ МНОГОФАКТОРНОГО АНАЛИЗА Оставив на некоторое время вопросы, связанные с историческим развитием факторного анализа, попытаемся изложить некоторые важнейшие зависимости и понятия, встречающиеся в современной теории многофакторного анализа. В основе этой теории лежит ряд существенных предпосылок. Од- ной из них является следующая: если мы имеем множество коэффи- циентов корреляции, выражающих зависимости между множеством исходных переменных, например, между тестами, то совокупность этих корреляций может быть определена при помощи некоторого числа общих для этих тестов факторов, которое, как правило, меньше числа тестов. Оценки отдельных переменных, полученные в ходе тестов, могут быть довольно экономно выражены в терминах именно этих общих факторов. Поскольку для тестов такими факторами являются способности, понимаемые в широком смысле как качества, необходимые для выпол- нения данного задания, каждая индивидуальная оценка,полученная за выполнение теста, теоретически определяется двумя обстоятель- ствами: а) способностями, необходимыми для выполнения данного теста; б) объемом этих способностей у данного индивида. Если предположить, что общие факторы (способности) некоррели- рованы, то описанная выше ситуация может быть выражена для q 42
некоррелированных факторов с помощью следующего уравнения1: = СЛХ1( + Cj2X2i + ... + CjQXQi, (3.1) где Sjt — стандартная оценка человека I при выполнении теста /; Cjq — содержание или нагрузка фактора q в тесте /; Xqi — объем фактора (способности) q у обследуемого человека. Как можно трактовать это уравнение с точки зрения психологии? Все С имеют индекс /’, а не I, так как относятся к тестам, а не к лю- дям- Они показывают, в какой мере данный тест требует определен- ных способностей. Наоборот, все X имеют индексы i, а не /, так как относятся к отдельным обследуемым людям, а не к тестам. Они пока- зывают, в какой степени данный человек обладает соответствующим качеством. Первый член правой стороны уравнения показывает долю первого фактора (способности) при выполнении теста, второй — долю вто- рого фактора, третий — третьего фактора, наконец, последующий — долю q-го независимого фактора. Предположим, что способность ’(фактор) 1 является решающим условием выполнения /-го теста. Тогда коэффициент СЛ будет поло- жительным и высоким. Если одновременно человек i в достаточной степени наделен этой способностью, т. е. Х1г будет положительным и большим, то произведение обеих величин внесет существенный вклад в хорошую оценку выполнения теста. Допустим, что способность 2 теперь совершенно не нужна для выполнения /-го теста. Тогда коэффициент Cj2 будет равен нулю. Если даже человек i щедро одарен этой способностью (стандартная оценка объема этой способности X2i положительна и высока), произ- ведение обоих коэффициентов будет равно нулю. Это означает, что для данного человека и данного теста эта способность не влияет на итого- вую оценку. В основе такой интерпретации лежит предположение, что большое разнообразие поведения людей, например, в ситуации выполнения заданий может быть описано и объяснено при помощи ограничен- ного числа основных свойств, факторов или способностей. б. ВАЖНЕЙШИЕ ПОНЯТИЯ, СВЯЗАННЫЕ С ДИСПЕРСИЕЙ В факторном анализе используется целый ряд понятий и зависи- мостей, тесно связанных с дисперсией. Дисперсия — это статистический термин, представляющий собой квадрат стандартного отклонения. Общепринятым обозначением дис- персии является символ о2. Дисперсию в случае тестов можно рас- сматривать как показатель степени, с которой удается разграничить индивидуальные различия. В более широком смысле дисперсия пред- ставляет собой один из показателей вариации или рассеивания. 1 В случае корреллированных факторов формула имеет более сложный вид. 43
В факторном анализе необходимо различать отдельные компоненты дисперсии. Полная дисперсия переменной z может быть разбита на три основ- ные компоненты (при предположении, что три соответствующие компо- ненты наблюдений между собой не коррелированы): 1) общая дисперсия, 2) специфичная дисперсия, 3) дисперсия, обусловленная ошибкой. Две первые компоненты полной дисперсии, т. е. общая и специфи- ческая дисперсии, образуют подлинную, постоянную, или надежную, дисперсию. Показателем их совместной значимости является коэф- фициент надежности, о котором мы говорили в предшествующем разделе. Общую дисперсию можно определить как ту часть постоянной дисперсии, которая коррелирует с другими переменными или яв- ляется общей для ряда переменных. Специфичная дисперсия представляет собой ту часть постоянной дисперсии, которая не коррелирует с другими переменными и прису- ща лишь одной определенной переменной. Наконец, дисперсия, обусловленная ошибкой, является случайной, вызванной ошибками в процессе выборки, неточностью инструментов наблюдения, отклонением от условий эксперимента, а применительно к тесту также и непредвиденными изменениями изучаемой единицы и целой совокупностью всех других факторов, вызывающих неточность (непостоянство) наблюдений. Обычно предполагается, что эта часть дисперсии не коррелирует с постоянной дисперсией. Пользуясь терминологией теории дисперсии, одну из основных задач факторного анализа можно определить как исследование полной дисперсии для определения числа и видов тех «общих дисперсий», которые обусловливают корреляции в данной совокупности пере- менных. Одновременно предполагается, что компоненты общей части наблюдений, соответствующие этим отдельным «общим дисперсиям», не коррелированы. Полную дисперсию переменной z можно представить как сумму ее компонент в виде формулы общая дисперсия специфичная дисперсия, обусловленная дисперсия ошибкой 2) = oli + О^2 +... + OJn “ф 4- ' cfb Символ п соответствует числу компонент, составляющих общую дисперсию. Если обе стороны этого уравнения разделить на ol, получится: 2 1,0= о! 2 OZ8 Ог (3.3) ®Z2 4 Левая сторона уравнения становится равной 1. Это означает, что полная дисперсия переменной равна теперь 1, а все составляющие 44
дисперсии на правой стороне уравнения, т. е. общая, специфичная и дисперсия, вследствие ошибки, оказались выраженными как доли полной дисперсии. Другими словами, уравнение (3.3) исходит из нор- мализованных соотношений, т. е. выраженных в единицах стандарт- ного отклонения. Обозначив каждую компоненту дисперсии соответствующим сим- волом, формулу (3.3) можно переписать в виде: 1,0 = щ^ + ^2 + ...+ш1п + 5^ + ^, (3.4) где %wzzk— общая дисперсия; k si — специфичная дисперсия; bz — дисперсия, обусловленная ошибкой. Общая дисперсия, составляющая ядро факторного анализа и обо- значаемая нами может состоять из п компонент (от wzi до wzn), k представляющих собой уже упоминавшиеся выше компоненты «общей дисперсии». Каждый элемент общей дисперсии представляет собой ту ее часть, которую можно приписать некоторому общему фактору. Напомним в этой связи о важном для факторного анализа понятии факторной нагрузки, которую Тэрстоун называет также коэффициентом теста. Факторные нагрузки представляют собой меру, в соответствии с которой данный тест или задание требуют для своего выполнения данной способности, т. е. данного свойства или данного фактора. Фак- торную нагрузку можно также назвать «наполнением» теста опреде- ленным фактором. Факторная нагрузка имеет форму коэффициента корреляции. В данном случае имеется в виду корреляция между данным тестом и некоторым фактором. Чем выше эта корреляция, тем в большей сте- пени тест «наполнен» данным фактором и тем в большей степени яв- ляется мерой этого фактора. Каким образом можно интерпретировать факторную нагрузку в терминах дисперсии? Выше уже указывалось, что каждая компонен- та общей дисперсии представляет собой ту ее часть, которая может быть приписана влиянию определенного фактора, общего для ряда переменных. Теперь формулируем следующую теорему. В случае некоррелированных факторов нагрузка фактора т равна квадратному корню из того элемента общей дисперсии, который можно приписать влиянию фактора т. Таким образом, квадрат каждой нагрузки фактора т в тесте / (Cjm) или С2Ут будет составлять ту долю общей дисперсии теста /, которую можно приписать фактору т. Оставим на некоторое время объяснения этого положения и алгеб- раическое доказательство теоремы; мы вернемся к этой проблеме при геометрической интерпретации основных зависимостей фактор- ного анализа. 45
Возвращаясь к рассчитанным выше компонентам дисперсии, структуру полной дисперсии представим следующим образом: -------——— полная дисперсия - падежная дисперсия 1-1X1 lZi ' общая дисперсия специфичная дисперсия 1*11 дисперсия, обусловленная ошибкой Схема 3.1 С точки зрения факторного анализа нас интересует прежде всего общая дисперсия, так как влияние каких-то основных совместных факторов будет находиться в ее границах. Кроме того, использование таких инструментов, как, например, тесты, функции, выражающие определенные свойства и прогноз успехов в работе или учебе, возмож- но лишь благодаря общей дисперсии. Тест как переменная «предска- зывает» только в той мере, в какой он коррелирует с каким-либо кри- терием или другой переменной. Специфичная дисперсия, связанная исключительно с некоторой переменной и только ее характеризующая, имеет здесь меньшее значение. Дисперсию, обусловленную ошибкой, стремятся обычно свести к минимуму путем создания оптимальных условий на каждом этапе получения данных. Перейдем теперь к изложению двух основных понятий, имеющих большое значение в факторном анализе и непосредственно связанных с приведенным выше делением полной дисперсии на компоненты. Рассмотрим прежде всего ту часть полной дисперсии, которая со- стоит из двух следующих элементов (см. 3.4):| Сумма этих элементов, т. е. отдельных общих дисперсий, которые могут быть приписаны некоторым общим факторам, равна той части дисперсий данной переменной, которая является общей с другими пе- ременными. Она называется общностью и обозначается /г2. Его проис- хождение будет объяснено при рассмотрении векторного представле- ния переменных. Это понятие кратко можно определить следующим образом: общность данной переменной — это та часть ее дисперсии, которая обусловливается общими для нескольких переменных факто- рами. Сказанное можно выразить формулой Й1=ш!1 + щ12 + Шг3+...+№1п. (3.5) Вторая часть полной дисперсии связана лишь с определенной переменной и свойственна только ей. Она иногда называется харак- терностью переменной (теста) и обозначается н2 (имеется в виду та часть дисперсии, которая не является общей для всех переменных). 46
Следовательно, полную дисперсию можно записать с помощью урав- нения 1,0 = й2 + «1. (3.6) При этом необходимо помнить, что характерность состоит из двух уже упоминавшихся элементов: специфичности, связанной со специ- фичными факторами, соответствующими только одной определенной переменной, и дисперсии, обусловленной ошибкой. Специфичных факторов также может быть больше одного. Теперь полную дисперсию можно представить в виде следующего развернутого уравнения: (w2Zi + wl2 + ... + w2Zn) + (s2zl+sf2 + ...+sim) + 6I= 1,0. — — - — - (3./) hi—общность —характерность Из уравнения видно, что как общность, так и характерность пере- менной имеют сложную структуру. Оно показывает также, что харак- терность может трактоваться как дополнение общности до единицы: г4 = 1,0—Л2. (3.8) Аналогично общность может рассматриваться как дополнение ц2 до 1: А2 = 1,0—и’. (3.9) Надежную дисперсию, о которой мы говорили выше, можно пред- ставить так: Надежная дисперсия = Л2 + s2, (3.10) т. е. как сумму общности и характерности дисперсии. Из этого уравне- ния вытекает, что общность переменной всегда меньше надежной дисперсии за исключением теоретического случая, в котором специ- фичность (s2) равна нулю. К изложенным здесь зависимостям мы еще вернемся при геомет- рической интерпретации основных понятий факторного анализа. в. МАТРИЦА КОРРЕЛЯЦИИ И МАТРИЦА ФАКТОРОВ Познакомившись с понятиями факторной нагрузки и области сов- местных изменений, можно пойти дальше, снова привлекая для из- ложения аппарат матриц, элементами которых на этот раз будут коэффициенты корреляции. Матрица коэффициентов корреляции, полученных, как правило, экспериментальным путем, называется матрицей корреляции, или корреляционной матрицей. Элементьг этой матрицы являются коэффициентами корреляции между всеми переменными данной совокупности. Если мы имеем, 47
например, набор, состоящий из п тестов, то число коэффициентов кор- реляции, полученных экспериментальным путем, составит n(n—1) 2 Эти коэффициенты заполняют половину матрицы, находящуюся по одну сторону ее главной диагонали. По другую сторону находятся, очевидно, те же коэффициенты, так как ru — га; г31 = г13 и т. д. Поэтому корреляционная матрица симметрична. 1 2 3 4 1 1 Г12 Г13 Г14 2 г2х 3 /'з1 1 Г32 Г23 1 Ги =Ег r3i 4 г41 >42 Г43 1 Схема 3.2. Полная матрица корреляции Ri На диагонали этой матрицы находятся единицы, поскольку корре- ляция каждой переменной с самой собой равна +1. Матрица корреляции, у которой элементы главной диагонали равны 1, называется «полной матрицей» корреляции (схема 3.2) и обозначается Необходимо отметить, что, помещая на главной диагонали единицы, или корреляции каждой переменной с самой собой, мы учитываем полную дисперсию каждой переменной, представленной в матрице. Тем самым принимается во внимание влияние не только общих, но и специфичных факторов. Наоборот, если на главной диагонали корреляционной матрицы находятся элементы (Lf), соответствующие общностям и относящиеся лишь к общей дисперсии переменных, то учитывается влияние только общих факторов, элиминируется влияние специфичных факторов и ошибок, т. е. отбрасываются специфичность и дисперсия ошибок. Матрица корреляции, в которой элементы главной диагонали соответствуют общностям, называется редуцированной и обозначается 7? (схема 3.3). 12 3 4 1 2 3 4 hl г1г /*21 h-22 Г31 Г32 Hl ri2 Г13 Г23 Г24 ЛзЗ Г34 Г43 ^44 Схема 3.3. Редуцированная матрица корреляции Выше уже говорилось о факторной нагрузке, или наполнении дан- ной переменной конкретным фактором. При этом подчеркивалось, что факторная нагрузка имеет вид коэффициента корреляции между данной переменной и данным фактором. Матрица, столбцы которой 48
состоят из нагрузок данного фактора применительно ко всем пере- менным данной совокупности, а строки — из факторных нагрузок данной переменной, называется матрицей, факторов, или факторной матрицей. Здесь также можно говорить о полной и редуцированной факторной матрице. Элементы полной факторной матрицы соответст- вуют полной единичной дисперсии каждой переменной из данной со- вокупности. Если нагрузки на общие факторы обозначить через с, а нагрузки специфичных факторов — через и, то полную фактор- ную матрицу можно представить в следующем виде: переменные общие факторы I II III характерные факторы 12 3 4 =Л 1 2 3 4 Сц С1г с13 ^21 ^22 ^23 С31 С32 С33 С41 ^42 С43 н* to to R со со Л Схема 3.4. Полная факторная матрица Fi для четырех переменных Показанная здесь факторная матрица состоит из двух частей Первая часть содержит элементы, относящиеся к четырем переменным и трем общим факторам, причем предполагается, что все они отно- сятся ко всем переменным. Это не есть необходимое условие, так как некоторые элементы первой части матрицы могут быть равными нулю, а это значит, что некоторые факторы относятся не ко всем переменным. Элементы первой части матрицы — это нагрузки общих факторов (например, элемент с12 показывает нагрузку второго общего фактора при первой переменной). Во второй части матрицы мы видим 4 нагрузки характерных фак- торов, по одной в каждой строке, что соответствует их характерности. Каждый из этих факторов относится лишь к одной переменной. Все другие элементы этой части матрицы равны нулю. Характерные фак- торы можно, очевидно, разбить на специфичные и обусловленные ошибками. Столбец факторной матрицы характеризует фактор и его влияние на все переменные. Строка характеризует переменную и, ее напол- ненность различными факторами, иначе говоря, факторную струк- туру переменной. При анализе только первой части матрицы мы имеем дело с фак- торной матрицей, показывающей общую дисперсию каждой перемен- ной. Эта часть матрицы называется редуцированной и обозначается F. Эта матрица не учитывает нагрузки характерных факторов и не принимает во внимание специфичной дисперсии. Напомним, что в соответствии со сказанным выше об общих дисперсиях и фак- торных нагрузках, представляющих собой квадратные корни из об- щих дисперсий, сумма квадратов элементов каждой строки редуци- рованной факторной матрицы F равна общности данной переменной 49
z (hl). Соответственно сумма квадратов всех элементов строки полной матрицы факторов Fx равна 1, или полной дисперсии данной перемен- ной. Так как в факторном анализе основное внимание уделяется общим факторам, то мы в дальнейшем будем использовать главным образом редуцированную корреляционную и редуцированную факторную матрицу. г. ОСНОВНЫЕ УРАВНЕНИЯ ФАКТОРНОГО АНАЛИЗА Процесс выделения факторов начинается с составления матрицы коэффициентов корреляции, определенных, как правило, путем экс- периментов. Цель состоит в переходе от редуцированной матрицы корреляции к редуцированной факторной матрице, которая позволит определить: а) сколько общих факторов необходимо для отражения всех корреляций между переменными изучаемой серии (число общих факторов равно числу столбцов редуцированной факторной матрицы) и б) каковы нагрузки каждого фактора для разных переменных (на- грузки всех факторов для одной переменной образуют строки фактор- ной матрицы). В основе этой процедуры лежит уравнение для некоррелированных факторов R = F • F'. Теперь можно сформулировать следующую теорему: редуциро- ванная матрица корреляции равна произведению редуцированной факторной матрицы на транспонированную. Эту основную зависи- мость можно проиллюстрировать на следующем примере: 1 2 3 4 С11 С12 С21 С22 С31 С32 С41 С42 F 2 3 С21 С31 С22 С32 F' 12 3 4 1 й? г12 г13 г14 2 /"21 Йу г23 г 24 3 г31 г82 й3 г 34 4 Гдх г42 г43 hi R 1 2 Схема 3.5. Редуцированная матрица корреляции R равна произведению редуци- рованной матрицы F на транспонированную матрицу F' Математическое доказательство этой теоремы мы здесь не приво- дим, так как это увело бы в сторону от основного направления, при- нятого нами в изложении материала. Читатель легко найдет это до- казательство в фундаментальных курсах по факторному анализу, например, в работе Тэрстоуна 1203]. Мы сосредоточим внимание на вытекающем из этой теоремы уравнении, позволяющем определить корреляции на основе факторных нагрузок. Это уравнение имеет 50
основополагающее значение в практике выделения факторов. Оно имеет следующий вид: гаЬ — ГаС\ Гьс{ + ЛгС2 Гьс2 4~ ••• + ГаСп fbCn (3.11) и означает, что корреляция между переменными а и b (гаЬ) в случае п некоррелированных факторов С, общих для обеих переменных, равна сумме произведений нагрузок каждого из факторов на эти пере- менные. Корреляция гасх и гьсх — это нагрузки фактора Сг по обеим переменным а и Ь. Корреляция гас2 и гьс2 — это нагрузки фактора С2 при переменных а и Ь. Наконец, гасп и Гъсп — нагрузки п-го фак- тора, общего для обеих переменных. Приведенное уравнение можно относительно легко вывести из ос- новной зависимости, представленной на схеме 3.5, учитывая при этом правила умножения матриц и принимая во внимание то,что эле- менты матриц F и F' представляют собой факторные нагрузки. Выше уже отмечалось, что при решении проблемы факторов исполь- зуется редуцированная факторная матрица. Приступая к анализу, исследователь располагает лишь исходной корреляционной матрицей, являющейся, по существу, полной матрицей если на ее главной диагонали находятся единицы. Однако в факторном анализе, как уже отмечалось, нас интересуют в основном только общие факторы и прежде всего потому, что именно они выражают собой влияния, лежащие в основе обнаруженных кор- реляций. Таким образом нужно анализировать общую дисперсию пе- ременных, а потому на главной диагонали должны находиться не еди- ницы, а элементы hl, соответствующие общностям. Другими словами, необходима редуцированная корреляционная матрица. Трудность заключается в том, что величины заранее неизвестны, так как их нельзя определить экспериментальным путем. Эту трудность можно обойти с помощью различных способов оценки величины hl. О них будет речь ниже, сейчас же целесообразно коснуться основных про- блем, связанных с рангом корреляционной матрицы. Ранг матрицы был определен в предыдущем разделе как максималь- ное число линейно независимых строк или столбцов. В теории фактор- ного анализа ранг корреляционной матрицы определяется несколько иначе. К этой проблеме мы еще вернемся при геометрической интерпре- тации основных зависимостей факторного анализа; здесь же будут при- ведены лишь некоторые важнейшие теоремы. Если элементами матрицы являются коэффициенты корреляции, то ранг редуцированной корреляционной матрицы равен числу общих факторов. Ранг полной корреляционной матрицы равен ее порядку. Можно показать, что матрица имеющая ранг п и порядок /г, может быть преобразована в факторную матрицу, включающую столько факто- ров, сколько тестов (переменных) в изучаемой серии. Такое преобра- зование, однако, не совсем желательно, так как основной предпосыл- 51
кой факторного анализа является определение корреляции большого числа переменных при помощи меньшего количества общих факторов. Так как ранг корреляционной матрицы, а следовательно, и число факторов, опосредствующих корреляции, зависит от того, какие ве- личины находятся на главной диагонали этой матрицы, то при прове- дении многофакторного анализа целесообразно выбирать такие эле- менты главной диагонали, чтобы ранг матрицы был по возможности меньшим. Принимается, что наиболее подходящими элементами являются величины, соответствующие общностям 3. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ НЕКОТОРЫХ ОСНОВНЫХ ЗАВИСИМОСТЕЙ До сих пор основные предположения и зависимости факторного анализа рассматривались в алгебраической форме. Теперь же попы- таемся сделать это с помощью графиков, используя некоторые геомет- рические понятия, или, как говорит Тэрстоун, геометрические анало- гии. Эти аналогии основываются не только на обычной, но и на ана- литической геометрии. Геометрическое представление основных проблем теории факторов имеет большое значение по двум причинам. Во-первых, на опреде- ленных этапах процедуры факторного анализа графическая интер- претация, как это будет показано ниже, является важным элементом, без которого нельзя довести процедуру до конца. Во-вторых, как по- казал опыт ряда специалистов по факторному анализу, многие трудности, с которыми сталкиваются не математики при знакомстве с математической стороной факторной теории, удается в значительной степени преодолеть благодаря графическому изображению различных зависимостей. В соответствии с широко распространенным мнением большинство студентов, изучающих, например, психологию и стал- кивающихся с факторным анализом, лучше понимают и запоминают те зависимости, которые были проиллюстрированы в геометрической форме. а. КОРРЕЛЯЦИЯ КАК СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ Рассмотрим прежде всего способ графического представления коэффициента корреляции, являющийся важным элементом более сложных методов геометрической интерпретации. Каждую из двух связанных друг с другом переменных можно представить как вектор, т. е. определенный отрезок прямой, имеющий определенную длину и направление (в аналитической геометрии век- тором называется направленный отрезок, т. е. с обозначенными на- чалом и концом; если А — начало вектора, В — его конец, то вектор обозначается АВ, а его длина, или абсолютная величина, —|ЛВ|). Если обе переменные представить в виде векторов (в случае тестов говорят о «векторах тестов»), то можно показать, что существующая 52
между ними корреляция равна скалярному произведению этих век- торов или произведению абсолютных величин обоих векторов на косинус угла между ними: г12 = h} ‘h2 -cos а12, (3.12) где г12 — коэффициент корреляции между переменными 1 и 2; — длина вектора, соответствующая первой переменной 1; Л2 — длина вектора, соответствующая переменной 2; а12 — Угол между векторами hx и Л2. Эту зависимость можно изобразить на графике. Из трактовки коэффициента корреляции как скалярного произведения вытекают интересные выводы, имеющие важное значение для геометрического представления зависимостей факторной теории. Первый такой вывод относится к нулевой корреляции, т. е. к слу- чаю ее отсутствия. Когда величина г12, представляющая собой ска- лярное произведение, будет равна нулю:1 Если предположить, что оба вектора и h2 больше нуля, то г12 будет равно нулю только тогда, когда cos а12 = 0. Известно, что нулю равен косинус угла 90°. От- сюда вывод: случай отсутствия корреляции, когда величины обоих векторов больше нуля, геометрически соответствует прямому углу между векторами. Второй вывод относится к отрицательной корреляции. Отрица- тельные коэффициенты корреляции всегда соответствуют тупым уг- лам (от 9O'J до 180°), при этом, как и ранее, предполагается, что величи- ны обоих векторов больше нуля. Это непосредственно связано с тем фактом, что косинус углов от 90° до 180° находится в границах от 0 до —1,0. Положительные корреляции будут соответствовать острым углам между векторами, так как косинус углов от 0° до 90° находится в гра- ницах от +1,0 до 0. Пойдем дальше. Если предположить, что оба вектора равны 1 (т. е. соответствуют полной дисперсии двух тестов), то hx = 'h2= 1 и скалярное произведение векторов будет просто равно косинусу угла между ними. В этом случае формула упростится и будет иметь вид: r12 = cos а12. (3.13) Каким образом эту зависимость можно проиллюстрировать на конкретном примере? Рассмотрим случай, когда угол равен 45°. Тогда косинус этого угла составит примерно 0,707 и в соответствии с формулой (3.13) коэф- фициент корреляции г — 0,707 можно изо- бразить при помощи двух единичных векто- ров, которые наклонены друг к другу под углом 45° (рис. 3.6). Рис. 3.6 53
На этом рисунке отрезок Аа перпендикулярен Оа. Из определения косинуса известно, что он равен частному от деления отрезков Оа на О А, т. е. иго Оа cos 45 = — . ОА Так как, по предположению О А = 1, то cos 45° = Оа. Отрезок Оа — это не что иное, как прямоугольная проекция век- тора 2 на вектор 1, равная в этом случае косинусу угла между векто- рами и одновременно коэффициенту корреляции между переменными, представленными в виде векторов. Теперь можно сформулировать тео- рему: скалярное произведение двух единичных векторов равно проекции одного из них на другой. Остается еще напомнить некоторые специальные термины, опираю- щиеся на геометрическую интерпретацию корреляции. Особенно часто в факторном анализе используется нулевая корре- ляция, которую можно представить при помощи взаимоперпендику- лярных векторов. Поэтому некоррелированные факторы на языке тер- минологии факторного анализа называются ортогональными (перпен- дикулярными), тогда как коррелированные факторы — косоугольными. б. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ С учетом изложенных выше принципов интерпретации коэффициен- та корреляции с помощью двух наклоненных друг к другу векторов можно перейти к геометрическому представлению корреляционной матрицы. 1 2 3 4 1 Из Г13 /14 2 Г21 Й2 Г 23 Г 24 = R 3 4 Г 31 гп Г.32 ^3 Г 42 Г43 Схема 3.6 Г 34 hl В качестве примера возьмем приведенную корреляционную матрицу 4x4 (рис. 3.6), включающую коэффициенты корреляции в серии из четырех тестов. Прежде всего необходимо различать элементы главной диагонали и остальные компоненты этой матрицы. Обратимся вначале к элементам главной диагонали. Каково их зна- чение для геометрической интерпретации корреляционной матрицы? Эти элементы характеризуют длину векторов (в нашем примере векто- ров тестов). Попытаемся это доказать. Каждый столбец или строка корреляционной матрицы соответству- ют одному тесту и включают корреляции этого теста со всеми другими. Возьмем, к примеру, первый столбец матрицы, относящийся к тесту 1. Первый коэффициент этого столбца лежит на главной диагонали. 54
В принципе этот коэффициент характеризует корреляцию с теста самим собой, однако в нашем случае он представляет собой только общность теста 1 (h2i), так как мы имеем дело с приведенной матрицей. Попытаем- ся представить эту корреляцию в виде скалярного произведения. Это будет произведение, образованное умножением вектора теста 1 (AJ на этот же вектор и на угол между ними (аи = 0). Так как косинус угла 0° равен 1, получим: A1-A1-cos ctu = А2. (3.14) Отсюда видно, что общность теста i является просто квадратом длины вектора Av Ясно также, что величины А2 должны быть всегда положительными. (Этим объясняется устоявшийся символ А2.) Подход к другим столбцам корреляционной матрицы аналогичен. Обобщая, можно сказать, что каждый элемент главной диагонали корреляцион- ной матрицы показывает длину соответствующего вектора теста. Каково значение всех других коэффициентов корреляционной мат- рицы? В самой общей форме можно утверждать, что если элементы главной диагонали показывают длину векторов, то остальные элементы соответствуют углам между этими векторами. Действительно, каждый коэффициент корреляции в столбце данного теста, показывающий его связь с другим тестом в серии, может быть представлен как скалярное произведение соответствующей пары векторов. Так, например, коэффи- циент г13 может быть представлен как скалярное произведение вектора теста 1 и вектора теста 3. С учетом вышесказанного, угол между этими векторами будет тупым, если г13 < 0, прямым, если г13 = Он острым, если г13> 0. в. КОНФИГУРАЦИЯ ВЕКТОРОВ Система векторов, в которой их длина соответствует элементам глав- ной диагонали, а углы — остальным элементам корреляционной мат- рицы, была названа Тэрстоуном конфигурацией векторов. Это понятие, очень важное в многофакторном анализе, часто будет использоваться в дальнейшем. Оставляя на некоторое время вопрос изображения конфигурации на плоскости и в пространстве, рассмотрим лишь наиболее общие соображения о связи между корреляционной матрицей и конфигурацией векторов. s. 1. Матрица корреляции с известными элементами главной диагона- ли определяет единственную, строго определенную, соответствующую ей конфигурацию векторов. В этом смысле можно считать, что корре- ляционная матрица определяет скалярные произведения всех связан- ных с нею пар векторов. 2. Длина каждого вектора, соответствующего определенной пере- менной, равна положительному квадратному корню из величины, ха- рактеризующей общность этой переменной. 3. Представляя корреляционную матрицу как конфигурацию век- торов или поступая в обратном порядке, мы не теряем информацию, которую несет в себе матрица или конфигурация. 55
4. Если корреляционная матрица включает лишь положительные или нулевые элементы, то в соответствующей ей конфигурации отсутст- вуют тупые углы между векторами. г. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ФАКТОРНОЙ МАТРИЦЫ Попытаемся так же, как в случае с корреляционной матрицей, дать геометрическую интерпретацию факторной матрицы, которая, как из- вестно, является конечным пунктом процедуры выделения факторов. В качестве примера возьмем редуцированную факторную матрицу F с двумя столбцами и четырьмя переменными (схема 3.7). I И 1 0,70 0,30 2 0,90 0,00 3 0,40 0,60 4 0,60 0,30 Схема 3.7. Факторная матрица с двумя общими факторами Мы уже знаем, что все элементы этой матрицы являются’фактор- ными нагрузками или корреляциями переменных и факторов. Напри- мер, коэффициент 0,70 в первом столбце и первой строке матрицы F представляет собой нагрузку фактора 1 у переменной 1. Для графичес- кой иллюстрации факторных нагрузок нужно обе скоррелированные друг с другом переменные изобразить в виде векторов. В результате мы будем иметь, с одной стороны, векторы, соответствующие перемен- ным (тестам), а с другой — векторы, соответствующие факторам. Обра- тимся вначале к векторам факторов. Как правило, фактор представляется в виде единичного вектора. В нашем примере факторная матрица содержит два столбца, или два ортогональных фактора. Следовательно, нужно изобразить два пер- пендикулярных единичных вектора, соответствующих двум не связан- ным друг с другом факторам. Такие векторы факторов (их не нужно путать с векторами, соответствующими переменным) играют особую роль. Они образуют систему отсчета, применительно к которой опреде- ляется положение векторов, соответствующих переменным (например, векторов тестов) . Поэтому эти векторы называются «векторами отсче- та», осями отсчета или просто осями координат1. Перейдем теперь к векторам, соответствующим переменным (напри- мер, тестам). Для геометрического изображения всех факторных нагру- зок в факторной матрице нужно определить положение каждого век- тора тестов относительно векторов факторов. С этой целью элементы каждой строки матрицы рассматриваются как координаты точки, 1 Здесь автор допускает некоторую вольность, так как в математической ли- тературе термин оси координат применяется к соответствующим прямым, а не к векторам. — Прим. ред. 56
явля ющейся концом соответ- ствующего вектора теста. Об- ратимся к рис. 3.7. На нем показаны две оси координат, изображенные в виде единич- ных векторов, представляю- щих факторы I и II. Возьмем, к примеру, пер- вую переменную в факторной матрице. Ее факторные на- грузки составляют 0,70 для фактора I и 0,30 для фактора II. Поэтому точка с координа- тами 0,70 на оси I и 0,30 на оси II будет являться концом вектора 1. Если эту точку со- единить с началом координат, Рис. 3 7 факт структура получим вектор 1, соответст- вующий переменной 1. Аналогично можно определить все остальные векторы. Что означает такая система? Обратимся снова к вектору 1. Отметим прежде всего, что обе фак- торные нагрузки представляют собой проекции вектора теста на оси координат (или единичные векторы факторов). В нашем примере они составляют 0,70 и 0,30. Длину вектора 1 можно определить с помощью теоремы Пифагора, так как этот вектор является гипотенузой прямо- угольного треугольника, катеты которого являются отрезками, пред- ставляющими факторные нагрузки. Если длину вектора I обозначить через то h\ = (0,70)2 + (0,30)2, откуда hj. =V (0,70)а + (0,30)2 = V0,58 = 0,7616. Первое из двух уравнений дает нам уже известную общность (в на- шем случае теста 1, или hi). Отсюда ясно видно, почему эта общность равна сумме квадратов факторных нагрузок. Понятно также, что вектор переменной (теста) 1 соответствует здесь лишь общей дисперсии, которая на (0,70)2 со- стоит из дисперсии, обусловленной фактором I, и на (0,30)2 — из дис- персии, обусловленной фактором II. - Рис. 3.7 позволяет получить и другие интересные результаты. На нем показаны еще три вектора, соответствующих переменным, поло- жение и длина которых определяются аналогично. Вектор 2 полностью совпадает с осью фактора I, составляя от нее 0,90 (проекция равна длине вектора), а проекция на ось фактора II равна нулю, так как этот вектор перпендикулярен оси II. Дисперсия переменной 2 состоит исключительно из дисперсии, обусловленной фактором I. Другими словами, нагрузка фактора II равна нулю. 57
Число векторов, представляющих переменные, соответствует коли- честву строк факторной матрицы F. Число осей координат, представ- ляющих переменные, соответствует количеству столбцов матрицы F. Каждая факторная нагрузка (фактора т при переменной /) ajm, являю- щаяся элементом факторной матрицы, представлена как проекция вектора переменной / на ось ординат т. Система векторов, представляю- щих переменные и полученных на основе факторной матрицы, есть не что иное, как конфигурация векторов, о которой уже говорилось выше. Вернемся к рис. 3.7. Будем трактовать его следующим образом: на конфигурацию векторов, определяемую корреляционной матрицей, наложена система координат, состоящая в этом случае из двух перпен- дикулярных единичных векторов, соответствующих двум независимым факторам. Другими словами, графическое изображение факторной матрицы представляет собой объединение двух основных элементов: конфигурации векторов и системы координат, образуемой единичными векторами факторов. Такое объединение Тэрстоун назвал факторной структурой. В соответствии с его концепцией это понятие можно определить следующим образом: факторная структура — это объеди- нение конфигурации векторов, соответствующих переменным данной серии, и векторов, образующих соответствующую систему координат. д. РАНГ КОРРЕЛЯЦИОННОЙ МАТРИЦЫ И ОСИ КООРДИНАТ Ранг матрицы был уже выше определен как наибольшее число ли- нейно независимых строк или столбцов. Ранг редуцированной корре- ляционной матрицы определялся как число содержащихся в ней общих факторов. Рассмотрим ранг редуцированной корреляционной матрицы с гео- метрической точки зрения. Общие факторы представлены в факторной структуре осями координат, наложенными на конфигурацию векторов. Из теоремы, в соответствии с которой ранг редуцированной корреля- ционной матрицы равен числу общих факторов, вытекает, что ранг реду- цированной корреляционной матрицы равен числу осей координат. Так как в соответствии с предположением о независимости векторов каж- дая ось должна быть перпендикулярна ко всем остальным осям, ранг корреляционной матрицы будет соответствовать размерности про- странства, необходимой для размещения факторной! структуры. Отсюда вытекает ряд интересных следствий. До сих пор мы исполь- зовали пример факторной структуры с двумя ортогональными, или взаимно перпендикулярными факторами. Этот случай простой, так как он изображается на плоскости. Если после анализа какой-либо корре- ляционной матрицы получается факторная матрица F с тремя столб- цами, соответствующими трем некоррелированным общим факторам, то нужно вычертить трехмерную систему координат, состоящую из трех взаимно перпендикулярных единичных векторов. Каждая пере- менная, представленная соответствующим вектором, характеризуется теперь тремя факторами, так как она дает проекции на три оси коор- динат, соответствующие трем факторам. В практике встречаются еще 58
более сложные случаи. Когда изучается большая совокупность психоло- гических, социологических или каких-либо других переменных, весь- ма часто получается множество корреляций, которые не удается объ- яснить даже при помощи трех факторов. Данная совокупность пере- менных может характеризоваться влиянием четырех, пяти или боль- шего числа факторов, которые нужно выделить при помощи факторного анализа. Редуцированная корреляционная матрица будет иметь ранг, превышающий 3. Как в этом случае будет выглядеть система векторов и можно ли ее представить на графике? Этот вопрос является камнем преткновения особенно для тех психологов и социологов, которые не знакомы с математикой и понятием n-мерного пространства (гипер- плоскостью). Постараемся показать, что ситуация не настолько трудна, как это может показаться с первого взгляда. е. n-МЕРНОЕ ПРОСТРАНСТВО Понятно, что графики или пространственные модели, охватываю- щие всю систему переменных, представленных векторами, можно строить лишь для двух- или трехмерных случаев. Для корреляций, объяснение которых требует привлечения 4 или более факторов, уже нельзя графически представить четырех- или пятимерные системы и невозможно построить модель в трехмерном пространстве. Поскольку такие совокупности корреляций встречаются на практике очень часто, закономерен вопрос о том, каким образом можно преодолеть эту труд- ность. Прежде всего необходимо уяснить, что невозможность изображения четырех- или пятимерных систем взаимноперпендикулярных осей координат не имеет решающего значения. Важно то, что математика располагает методами решения геометрических задач в таком «неизо- бразимом» четырех- или пятимерном пространстве. Это пространство, естественно, лишь воображаемое, и используется как символ определен- ных зависимостей, встречающихся, например, в факторном анализе. Пространственное изображение этих зависимостей носит символический характер даже в случае только двух или трех факторов. К счастью, проблемы n-мерного пространства удается решить при помощи тех же правил, которые применяются в случае понятного нам и «изображае- мого» трехмерного пространства. В практике такие n-мерные системы также можно представить графически. При этом одновременно прини- маются во внимание лишь 2 или 3 фактора и их проекции на оси коор- динат и не учитываются остальные факторы. Такой метод представле- ния п-мерных систем будет подробно рассмотрен в разделе, посвящен- ном вращению осей координат. ж. НЕЗАВИСИМОСТЬ ПОЛОЖЕНИЯ СИСТЕМЫ КООРДИНАТ ОТ КОНФИГУРАЦИИ ВЕКТОРОВ Делая вводные замечания, мы уже указывали, что одна из основных задач многофакторного анализа, заключающаяся в определении на- грузок разных факторов для разных переменных данной совокуп- 59
ности, не имеет математически однозначного решения. Используя уже знакомые нам термины, можно сказать, что факторная матрица F, по- лученная в результате анализа, не есть единственно возможная. Чтобы уяснить это, нужно вспомнить некоторые приведенные ранее зависимости. Прежде всего вспомним, что существует строгая связь между корреляционной матрицей и конфигурацией векторов. Конфи- гурация дает' корреляционную матрицу в геометрическом смысле. Такая же связь существует между факторной матрицей и факторной структурой. Однако ни в корреляционной матрице, ни в конфигурации векторов нет системы координат, представляющей факторы. Эта си- стема присутствует в факторной структуре и в факторной матрице. Нельзя, однако, определить факторную структуру, пока на конфигу- рацию не будет наложена система координат. Только тогда можно го- ворить о проекциях векторов на оси координат, соответствующие фак- торным нагрузкам. Развивая это утверждение, вспомним еще раз последовательные этапы многофакторного анализа, используя уже знакомые нам поня- тия. Анализ начинается с матрицы корреляций (7?) между переменными данной совокупности. Цель заключается в получении факторной мат- рицы F, которая позволит воссоздать корреляции, содержащиеся в R, с учетом основной теоремы факторного анализа, выраженной уравне- нием F-F' = R. Каким образом можно представить себе эту цель с геометрической точки зрения? Для ее достижения нужно определить ранг матрицы R, который, с одной стороны, равен размерности, необходимой для по- строения конфигурации векторов, представляющих переменные, а с другой, равен числу столбцов факторной матрицы F. Уже на этом этапе можно, во-первых, однозначно изобразить конфи- гурации векторов и, во-вторых, наложить на нее систему осей коорди- нат для получения факторной структуры (рис. 3.8). Наложив систему осей координат на конфигурации векторов так, чтобы начало координат (О) совпало с точкой, откуда выходят все век- Рис. 3.8. Конфигурация, система координат и факторная структура в двумерной задаче: а) конфигурация; б) система координат; е) факторная структура 60
Рис. 3.9. Два положения системы координат относительно одной и той же кон- фигурации векторов в двумерной задаче торы конфигурации (рис. 3.8, в), можно определить проекции всех векторов на каждую из осей. Эти проекции образуют элементы фактор- ной матрицы F. Ясно, что нельзя получить матрицу F до тех пор, пока система координат не будет наложена на конфигурации векторов. Ясно также, что положение системы координат относительно конфигурации может быть различным. Здесь мы и подошли к сути проблемы: числен- ные значения проекций всех векторов, представляющих переменные, на оси, соответствующие факторам, зависят от положения системы координат относительно конфигурации векторов (рис. 3.9). Поскольку таких положений может быть бесконечно много, полу- чаем бесчисленное множество совокупностей факторных нагрузок (проекций векторов на оси). Другими словами, можно построить бес- численное количество факторных матриц F, каждая из которых вос- создает (в границах ошибок выборки) данную корреляционную мат- рицу R. Отсюда следует, что задача определения на основе матрицы Д соот- ветствующей ей матрицы F не имеет однозначного решения. Для полу- чения такого решения необходимо ввести в задачу некоторые условия или ограничения, которые подробно будут рассмотрены в главе, посвя- щенной вращению осей координат. з. ПРОСТРАНСТВО ОБЩИХ ФАКТОРОВ И ПРОСТРАНСТВО ТЕСТОВ Обсуждавшаяся выше связь между корреляционной матрицей и кон- фигурацией векторов различается в зависимости от того, что находит- ся на главной диагонали этой матрицы — единицы или же общности. Другими словами, эта связь зависит от того, полная или редуциро- ванная матрица используется. Проблема конфигурации в случае редуцированной матрицы была уже подробно рассмотрена выше. Случай с полной матрицей можно проиллюстрировать с помощью примера Тэрстоуна, в котором фигури- рует корреляция между двумя тестами р и q. Порядок такой корреля- ционной матрицы равен 2 и ее анализ будет исключительно простым 61
Если на диагонали записать единицы, получим следующую матрицу: Р q Р 1 грд . q rqP 1 Ясно, что в геометрической интерпретации нуждается лишь коэф- фициент грд. Вся конфигурация, соответствующая этой матрице, будет состоять из одной пары векторов, длина которых равна 1. Косинус угла между этими векторами и будет равен коэффициенту корреляции Грд (ИЛИ Гдр). Если все переменные данной совокупности (например, серии тес- тов) представлены единичными векторами (версорами), выражающими не общую, а полную дисперсию каждой переменной, то соответствую- щая конфигурация будет включать столько единичных векторов, сколько переменных в серии. Каково будет в этом случае число осей, представляющих факторы, или какова будет размерность пространства? Если число переменных в серии обозначить через п, а число общих фак- торов — через т, то конфигурация п единичных векторов будет рас- полагаться в п-|-т-мерном пространстве. Это пространство, включаю- щее как общие, так и специфичные факторы, соответствующие от- дельным переменным, Тэрстоун называет тестовым пространством в отличие от пространства, определяемого лишь общими факторами. Это последнее пространство, используемое в случае редуцированной корреляционной матрицы, называется пространством общих факторов. Пространство теста содержит, как правило, больше факторов, чем переменных. За исключением особых случаев оно не используется в многофакторном анализе, поскольку основная цель последнего со- стоит в определении именно общих факторов, число которых предпо- лагается меньше, чем число переменных в серии. и. ТРЕХМЕРНЫЕ МОДЕЛИ Рассмотрение этого случая начинается с утверждения, что конфи- гурацию векторов можно представить в виде физической модели, если ранг матрицы меньше 4. Двумерную задачу можно представить на пло- скости, трехмерную — в трехмерном пространстве. До сих пор мы ис- пользовали двумерные случаи. Это были особые примеры, в которых для объяснения корреляций было достаточно только двух общих фак- торов. Однако уже априори очевидно, что в случае большего числа переменных для объяснения найденных корреляций может потребо- ваться больше факторов. На практике, когда имеют дело с экспери- ментальными данными, часто даже при малом числе переменных кон- фигурация векторов может не поместиться в одной плоскости. Уже три вектора, представляющих три переменные, не укладываются в одной плоскости, если не выполняется некоторое специальное условие, иллю- стрируемое рис. 3.10. Сумма углов сОЬ и ЬОа должна быть в точности равна углу сОа. В противном случае три вектора не образуют веера 62
в одном пространстве и будут иметь вид, по образному сравнению Кеттелла, пучка спиц частично открытого зонта. Для объяснения таких трех коэффициентов корреляции необходимо третье измерение. В случае трех общих факторов редуцированную корреляционную матрицу можно также представить с помощью совокупности векторов, скалярные произведения которых являются соответствующими коэф- фициентами корреляции. Конфигурация векторов помещается в трех- мерном пространстве, когда ранг редуцированной корреляционной матрицы равен 3 и когда предполагается существование трех ортого- нальных факторов. Для такой конфигурации можно построить (вслед за Тэрстоуном) наглядную модель из простых материалов, например из шарика, сделанного из пробки, и обычных шпилек, изображающих векторы. Такая модель показана на рис. 3.11. Здесь также корреляция между каждой парой переменных равна скалярному произведению /zj-/z2-cos ct12, где h1nh2 — длина шпилек, а — угол между ними. Как и ранее, длина каждой шпильки равна кор- ню квадратному из общности данной переменной (/г2). Уже предвари- тельный анализ некоторых бросающихся в глаза свойств конфигурации векторов позволяет приблизительно оценить некоторые характерные свойства корреляционной матрицы. Например, модель, изображенная на рис. 3.11, не имеет тупых углов между шпильками. Вся конфигу- рация помещается в пределах прямого угла. Это означает, что корре- ляционная матрица включает положительные или нулевые коэффи- циенты корреляции. Каждому нулевому коэффициенту соответствуют два взаимно перпендикулярных вектора. Большим положительным ко- эффициентам корреляции соответствуют небольшие острые углы. Если несколько переменных сильно коррелируют друг с другом, соответст- вующие векторы изображают нечто, напоминающее пучок стрел в кол- чане. В этом случае мы получаем «связку» векторов, соответствующую «связке» корреляций. Эти термины вошли в арсенал терминологии фак- торного анализа. Связки корреляций играют важную роль в процеду- рах выделения факторов, являясь как бы первой уликой, выводящей на след скрытых за ними предполагаемых факторов, обусловливающих высокую корреляцию. На рис. 3.12 изображен типичный пример конфигурации, охваты- вающей три пучка векторов. Векторы, образующие пучок, соответст- вуют сильно коррелированным переменным. Между переменными от- дельных пучков корреляции невелики; если пучки примерно перпен- 63
дикулярны, то эти корреляции будут близки к нулю. Этот случай и изображен. Конфигурация этого типа предполагает допущение, что вся совокупность корреляций обусловливается тремя статистическими независимыми параметрами. Оси, представляющие эти параметры, должны проходить через центры пучков и быть взаимно перпендику- лярными. Следы пучков можно обнаружить при анализе корреляционной матрицы, не прибегая к пространственной модели, так как эта матри- ца показывает высокие корреляции для определенных групп перемен- ных и низкие корреляции между переменными разных групп. Рассмотрим еще один тип конфигурации, изображенный на рис. 3.13 и имеющий большое значение для дальнейшего изложения. В этом случае шпильки, соответствующие векторам, расположены в трех перпендикулярных плоскостях, а конфигурация образует пира- миду с треугольным основанием и вершиной в центре шарика. Все векторы лежат на стенах пирамиды и выходят из ее вершины. 64
При такой конфигурации векто- 1 ров можно предполагать, что все кор- ’ в реляции обусловливаются тремя фак- торами и (это более существенно) что три фактора могут быть представлены i®\ тремя осями, совпадающими с ребра- f $ \ ми пирамиды, выходящими из одной U с вершины. Иначе говоря, оси такой _ системы координат будут располагать- " \\ // ся вдоль линий, лежащих на Пересе- чении боковых сторон пирамиды. Каждый вектор такой конфигурации Рис’ 315 лежит в одной из трех плоскостей, об- разуемых соответствующей парой осей координат. В результате каж- дый вектор может быть определен проекциями только на две из трех осей (проекция на третью ось равна нулю). Такой тип конфигу- рации со всеми векторами, лежащими на сторонах пирамиды, можно легко представить с помощью модели из картона. Ее можно скон- струировать, например, отрезая угол какой-либо картонной коробки. С помощью такой модели (рис. 3.14) легко просматриваются свойства указанной конфигурации. Кратко напомним еще один распространенный способ изображения конфигурации векторов в трехмерных задачах. Этот способ заклю- чается в размещении конфигурации в границах шара с радиусом, рав- ным 1. Затем длина всех векторов доводится до единицы. После этого концы векторов можно представить как точки на поверхности этого шара с радиусом, равным 1. На практике поступают таким образом, что на поверхности деревянного шара обозначают точки, в которых она про- резается тремя перпендикулярными осями. Соединяя эти точки линия- ми, получают чертеж равностороннего сферического треугольника. Стороны треугольника будут линиями пересечения поверхности шара плоскостями, обозначенными осями. Если оси этой системы обозначить буквами Л, В и С, а концы векторов — кружочками, то описанная конфигурация будет изображаться на рис. 3.15. Приведенный выше способ представления конфигурации векторов позволяет в доступной форме иллюстрировать различные задачи и об- легчает предварительный анализ материала. Здесь мы опускаем расчет- ную и техническую сторону процедуры, с которой читатель может оз- накомиться в работе Тэрстоуна по многофакторному анализу. Заканчивая этот раздел, являющийся введением в некоторые основ- ные понятия факторного анализа, дадим (следуя Тэрстоуну) крат- кое резюме описанных геометрических концепций, касаясь лишь их важнейших моментов. 1. Для того чтобы выписать факторную матрицу, на конфигурацию векторов нужно наложить оси координат. 2. Так как полученная экспериментальным путем корреляционная матрица не определяет осей системы координат, любая факторная мат- 3 зак. 377 65
рица является, по существу, лишь факторной интерпретацией данных корреляций. 3. Элементы строки матрицы ортогональных факторов образуют независимые компоненты вектора данной переменной. 4. Столбец факторной матрицы представляет собой ось координат или фактор в факторной структуре. 5. Геометрическим аналогом факторной матрицы является фактор- ная структура, объединяющая в себе векторы и систему координат. 6. Каждому фактору соответствует ось, длина которой находится в границах от +1,0 до —1,0. 7. Корреляционную матрицу можно рассматривать как множество скалярных произведений всех пар векторов, представляющих пере- менные. 8. Длина каждого вектора равна положительному корню квадрат- ному из его общности. 9. Корреляционная матрица с известными элементами главной диа- гонали однозначно определяет конфигурацию векторов, которую можно представить с помощью физической модели, если ранг матрицы меньше 4. 10. Корреляционная матрица не определяет системы координат. 11. Корреляционную матрицу можно представлять в виде конфигу- рации векторов, и наоборот, не теряя при этом какого-либо количест- ва информации. 12. Положительному коэффициенту корреляции соответствует па- ра векторов, образующих острый угол. 13. Отрицательному коэффициенту корреляции соответствует пара векторов, образующих тупой угол,
Глава четвертая ЦЕНТРОИДНЫЙ МЕТОД ОПРЕДЕЛЕНИЯ ФАКТОРОВ 1. ВСТУПИТЕЛЬНЫЕ ЗАМЕЧАНИЯ В предыдущих разделах мы в общих чертах рассмотрели важней- шие зависимости и предположения теории многофакторного анализа. Вооружившись полученными знаниями, попытаемся теперь изложить конкретную процедуру выделения факторов по корреляционной мат- рице. При этом мы будем стараться знакомить читателя с более деталь- ной информацией по предмету. Мы уже знаем, что исходной точкой анализа является корреляцион- ная матрица, а его целью — факторная матрица. С геометрической точки зрения это означает наложение на конфигурацию векторов соот- ветствующей системы осей координат такой размерности, которая соот- ветствует рангу корреляционной матрицы. Существует много способов конкретного выполнения этой операции. Они называются методами выделения факторов. Каждый из этих методов характеризуется своими проблемами, своими специфическими трудностями, достоинствами и недостатками. Полное описание многих методов выделения факторов вместе с их теорией и историей потребовало бы написания работы, ко- торая не укладывается в рамки данной книги. Поэтому мы ограничимся здесь более глубоким рассмотрением толь- ко одного метода многофакторного анализа, носящего название ценгпро- идного, или метода центра тяжести. Автором метода является Тэрстоун. Полное описание его матема- тических основ он дал в [203]. Как уже отмечалось, существует много методов определения фак- торов. Результаты, полученные любым методом, можно интерпретиро- з* 67
йать в терминах другого метода. Центроидный метод представляет со- бой наиболее общий метод выделения факторов. Учитывая характер данной книги, представлялось целесообразным изложение именно этого метода, поскольку, несмотря на ряд недостатков, которые будут отмечены, он имеет основополагающее теоретическое значение, при- чем связанные с ним расчеты относительно просты1. Поэтому на при- мере с шестью переменными будут проиллюстрированы основные опе- рации центроидного метода и показаны его теоретические принципы. 2. ОСНОВЫ РАСЧЕТА ФАКТОРНЫХ НАГРУЗОК В ЦЕНТРОИДНОМ МЕТОДЕ Значение геометрической интерпретации множества взаимных корреляций и связанных с ними факторов при изложении факторной теории заключается прежде всего в том, что она облегчает понимание основных зависимостей. На практике, когда нужно рассчитать фактор- ные нагрузки или проекции векторов на оси координат, дело обстоит иначе, так как трудно вычерчивать системы векторов на бумаге или строить модели. Действительно, помимо технических трудностей су- ществуют невыполнимые задачи изображения системы в четырех- или пятимерном пространстве. Поэтому при расчете факторных нагрузок нужно перейти от геометрического к алгебраическому решению зада- чи. Этот переход можно осуществить довольно просто, поскольку всем вышеприведенным геометрическим представлениям, также как и тем, которые будут введены далее, соответствуют определенные расчетные операции. Благодаря им можно, например, непосредственно опреде- лить величины проекций векторов на оси факторов. Это никоим обра- зом не означает полного отказа от графического изображения, когда размерность задачи больше четырех. Как уже указывалось, даже в этом случае можно учитывать по две размерности одновременно и пред- ставлять на графике положение отдельных векторов относительно осей, разбивая тем самым задачу на составные элементы. При описании алгебраической процедуры расчета факторных на- грузок на основе совокупности корреляций целесообразно вспомнить зависимость, имеющую здесь основополагающее значение. Речь идет об уже приводившемся фундаментальном уравнении многофакторного анализа, описывающего связь между коэффициентом корреляции и соответствующими факторными нагрузками. Напомним, что это уравнение имеет вид: ГаЬ^=гаС1 fbCt + гос2 <6С2+ ... +ГаСпГбСп. (3.11) 1 Центроидный метод является упрощенным апроксимационным вариантом метода главных факторов. Его основное достоинство—доступность для ручного счета. С появлением ЭВМ этот ранее весьма популярный метод уступил пози- ции более точным методам факторизации.—Прим. ред. 68
С помощью этого уравнения можно рассчитывать корреляцию Меж- ду двумя переменными, если известны нагрузки общих для них факто- ров. В практике факторного анализа речь идет о противоположной задаче: на основе известных корреляций нужно рассчитывать фактор- ные нагрузки. Попытаемся найти способ решения этой задачи, предпо- лагая для упрощения, что существует лишь один общий фактор Сх. Допустим, что известны корреляция переменной а с шестью другими переменными: b, с, d, е, f, g. Каждая из этих переменных характеризуется нагрузкой общего фактора Сх. Теперь с учетом приведенной зависимости можно напи- сать следующие уравнения: ГаЬ=(.ГаС1)Х(ГьС1У, Гас = (ГаС1)Х(гсС1)} rad=^(raCi)Xi dCt)) rae = (.raCt)X(reCiy, Г^каС^Х^сУ, rag = (.racl)X(rgc1). Правая сторона всех уравнений содержит корреляцию гасг От- сюда следует, что при суммировании относительно большого числа та- ких произведений в столбце разница между коэффициентами корреля- ции переменных b, с, d и т. д. с фактором Сх становится незначительной по сравнению с суммой всех произведений. Получается число, являю- щееся в нашем случае суммой шести коэффициентов гас±. С учетом этого формулируется следующая теорема: средняя корреляция пере- менной со всеми другими переменными, рассчитанная из суммы всех корреляций в столбце, пропорциональна корреляции этой переменной с общим фактором гасг На практике такая корреляция рассчитывается путем суммирования элементов столбца и деления полученной суммы на корень квадратный из суммы всех столбцов матрицы. На эту основ- ную операцию опирается процедура выделения факторов по матрице парных корреляций. Процедура будет показана ниже на конкрет- ном числовом примере. 3. ПРОИСХОЖДЕНИЕ НАЗВАНИЯ «ЦЕНТРОИДНЫЙ МЕТОД» Для ознакомления с новым основным понятием факторного анализа нужно кратко описать геометрическую интерпретацию задачи. Как уже отмечалось, система векторов, представляющих перемен- ные в пространстве, определяется взаимными корреляциями этих пе- ременных и является в этом смысле постоянной «конфигурацией». На- оборот, система отсчета, т. е. оси координат, накладываемые на эту конфигурацию векторов, может принимать бесконечное множество раз- личных положений. Каждый метод расчета нагрузок определяет неко- торое положение системы координат, обусловленное предположениями 69
Рис. 4.1. Центроид системы векторов этого метода и характерное толь- ко для него. Эти исходные поло- жения осей координат не явля- ются окончательными и изменя- ются на следующих этапах фак- торного анализа. Сейчас же нас интересует вопрос о том, каким образом описанный выше метод расчета нагрузок первого обще- го фактора или проекций векто- ров на ось фактора Сх опреде- ляет направление этой оси. При после попытке геометрической интерпретации ситуации, возникшей расчета нагрузок первого фактора, оказалось бы, что первая ось проходит через центр пучка векторов, через его центральный пункт (центроид), т. е. через центр тяжести. Отсюда и происходит название «центроидный метод», или «метод центра тяжести». В каком смысле здесь понимается центр тяжести? Если концы векторов представить в виде оловянных шариков, а сами векторы в виде невесомых прути- ков, то ось пройдет через центр тяжести системы шариков. На рис. 4.1 он обозначен Sx. Рассчитывая факторные нагрузки описанным ниже способом, мы и определяем положение точки Sx относительно точки 0, в которой начи- наются все векторы, что в свою очередь определяет направление первой оси Сх, проходящей через точки 0 и Sx. Очевидно, нельзя предполагать, что все векторы будут находиться в одной плоскости и что для объясне- ния области общих изменений потребуется лишь два фактора. Если, однако, в целях упрощения временно принять такое искусственное предположение и допустить, что рассматривается двумерная задача, в которой все векторы лежат в одной плоскости, то можно утверждать, что сумма положительных проекций векторов на вторую центроидную ось, которая перпендикулярна к первой и лежит с ней в одной плоско- сти, равна сумме отрицательных проекций на эту ось. Этот случай характеризует положение, которое называется центроидным. Отсюда и происходят такие специфические термины, как центроидный метод, центроидные факторы, центроидная ось. 4. ОПРЕДЕЛЕНИЕ НАГРУЗОК ПЕРВОГО ОБЩЕГО ФАКТОРА Вернемся к изложению основной процедуры расчета факторных нагрузок на основе матрицы корреляций. Используем для этого конкретный числовой пример. Но прежде сделаем несколько вступи- тельных замечаний. В большинстве работ по факторному анализу в этом случае пользуются условными данными, являющимися в не- котором смысле идеальными, т. е. подобранными таким образом, что- бы анализ давал полностью однозначные и заранее определенные ре- зультаты. Это делается в целях упрощения и ясности изложения. 70
Представляется, однако, что такой подход хотя и облегчает понимание основных зависимостей, имеет тот недостаток, что он слабо подготав- ливает читателя к самостоятельному применению факторного анализа, так как приучает его к «идеальным» результатам, легко получаемым на условных данных. Поэтому в процессе дальнейшего изложения будут использоваться реальные данные, полученные экспериментальным путем. Это будет множество корреляций, рассчитанных на основе исследований, прово- дившихся в свое время автором. Они касались совокупности шести тестов, реализованных в группе учеников профессиональной школы. Однако для того, чтобы подчеркнуть общий характер факторного анализа как метода научных исследований, мы будем говорить не о тестах, а просто о «переменных». Так как количество переменных равно шести, число коэффициентов корреляции с учетом известной формулы составит (6x5) : 2 = 15. Чтобы на их основе построить корреляционную матрицу, нужно начертить таблицу, имеющую шесть строк и шесть столбцов (см. табл. 4.1). Соответствующие переменные обозначены через ^1» ^2> •••> ^в- Таблица 4.1 Редуцированная корреляционная матрица для шести переменных Переменные Zj z, Z, Z. z„ ze 1 2 3 4 5 6 7 8 Zj 0,400 0,299 0,400 0,297 0,116 0,232 1,744 z2 0,299 0,568 0,568 0,534 0,432 0,154 2,555 z3 0,400 0,568 0,568 0,487 0,436 0,071 2,530 0,297 0,534 0,487 0,545 0,545 0,092 2,500 zB 0,116 0,432 0,436 0,545 0,545 0,016 2,058 z6 0,232 0,154 0,071 0,032 0,016 0,232 0.765 2т 1,744 2,555 2,530 2,500 2,058 0,765 Cl 0,500 T = 0,733 = 12,152; ) Крите] 0,726 rT=3,481 1 ЭИЙ 0,717 1 598; —7= Vt —=3,485! Г 0,590 -=0,28681 )2. 0,219 J Критерий SCj =3,485. Анализ начинается с поиска первого фактора, общего для всех включенных в матрицу переменных. Для определения его нагрузки по переменной Zr нужно просуммировать все корреляции в столбце Zt и рассчитать их среднюю. Однако прежде всего необходимо выполнить важную операцию. Для получения редуцированной корреляционной матрицы на главной диагонали нужно записать величины, соответствующие значению 1\
общности (Л2), т. е. области общих изменений. Этот шаг имеет решающее значение, если учесть, что нашей целью является такое определение элементов главной диагонали, при котором ранг корреляционной мат- рицы был по возможности минимальным. В этом случае мы получаем возможность объяснить совокупность корреляций при помощи мини- мального числа общих факторов. Предполагается, что именно величи- ны (h2) соответствуют указанным требованиям. Наибольшая трудность заключается теперь в том, что, приступая к факторному анализу, мы не знаем величин (/г2), так как их нельзя определить экспериментальным путем. Поэтому эти величины оцени- ваются до некоторой степени произвольно. Существуют различные спо- собы их оценки, о чем мы будем говорить ниже. Здесь же отметим лишь, что один из этих способов заключается в записи на главной диагонали наибольшего коэффициента корреляции в данном столбце. Эта величи- на всегда записывается как положительная независимо от знака наи- большего коэффициента в столбце. Построив таким способом редуци- рованную корреляционную матрицу, можно приступить к расчету на- грузок первого общего фактора. Последовательность действий такова: 1) суммируем элементы каждого столбца, включая h2 с учетом ал- гебраических знаков; сумма записывается под столбцами в строке Sr, для контроля суммы строк записываются в последнем столбце таблицы; 2) складываются все суммы столбцов; получающаяся величина, обозначенная буквой Т, составит в нашем примере 12,152. Далее вычисляется У Т = 3,48598; 3) суммы столбцов делятся на У Т, в результате чего определяются нагрузки первого фактора для шести переменных или их корреляции с этим фактором. Таким образом, нагрузка фактора Сх для переменной а определяется по формуле с,. = ^, (4.1) где Sra — сумма коэффициентов корреляции в столбце переменной а, Т — сумма всех коэффициентов корреляции в матрице; 4) рассчитанные таким способом величины Сх записываются в по- следней строке таблицы; 5) определяется дополнительно величина= 0,28686. Она слу- жит критерием правильности расчетов. Действительно, произведение Т • Должно быть равнойТ , если расчеты были достаточно точны- ми. В нашем случае получаем (12,152) х (0,28686) = 3,48592, что совпадает с рассчитанной выше величиной с точностью до четырех десятичных знаков. Другим критерием является сумма всех фактор- ных нагрузок, которая должна быть равна УТ . В нашем примере эта сумма равна 3,485, что совпадает с точностью до трех десятичных знаков. На этом заканчивается расчет нагрузок первого общего фактора. 72
5. ОПРЕДЕЛЕНИЕ НАГРУЗОК СЛЕДУЮЩИХ ФАКТОРОВ До настоящего момента из совокупности корреляции был выделен один «центроидный» фактор, общий для всех шести переменных. Мы уже знаем, что с геометрической точки зрения число факторов равно числу осей, необходимых для представления структуры совокупности корреляций. На данном этапе анализа определена одна ось. Каковы же алгебраические и расчетные операции, связанные с процедурой вы- деления следующих факторов? Определяя нагрузки первого центроидного фактора, мы выделили из совокупности коэффициентов корреляции некоторую часть общей дисперсии, которая может быть приписана влиянию первого фактора. Поэтому первым шагом должен быть расчет новых коэффициентов кор- реляций, выражающих ту часть остающейся общей дисперсии, которая может быть отнесена на счет других факторов. Расчет этих «остатков», так обычно они называются для краткости, опирается на приводив- шуюся выше теорему о том, что корреляция двух переменных, вызван- ная каким-либо общим для них фактором,равна произведению на- грузок этого фактора для обеих переменных, т. е. произведения их корреляций с этим фактором. Поэтому корреляция г между Z± и Z2, обусловленная первым фак- тором, равна произведению его нагрузок по этим переменным, т. е. rZlZl = rZl ct Xrz, с, = 0,500x0,733 = 0,366 (см. табл. 4.1). Однако экспериментально рассчитанная корреляция равна 0,299. Для определения остатка нужно от первоначальной величины вычесть рассчитанную выше, т. е. 0,299 — 0,366 = —0,067. В нашем примере абсолютная величина вычитаемого больше, чем уменьшаемого. Следовательно, получается отрицательная корреля- ция —0,067, которая должна быть объяснена с помощью следующего фактора или факторов. Отрицательный знак перед «остатком» корреля- ции означает просто, что нагрузки второго фактора у переменных Zx и Z2 имеют противоположные знаки. Такие отрицательные остатки встречаются на практике весьма часто: примерно 50% остатков в мат- рице имеют отрицательный знак. Вычитание произведения нагрузок из первоначальных значений г осуществляется для каждой пары переменных. В результате получим: rZlZi = 0,400 — (0,500) х (0,500) = 0,150; гг,г, = 0,299 — (0,500) х (0,733) = —0,067; rZlZa = 0,400 — (0,500) X (0,726) = 0,037; rZlZl = 0,297 — (0,500) х (0,717) = —0,061... и. д. Аналогично рассчитываются остатки во всех других столбцах с учетом алгебраических знаков. Для больших корреляционных матриц можно использовать удобный прием для построения таблицы 73
Произведений нагрузок первого фактора. Вверху и в левой части такой таблицы записываются факторные нагрузки всех переменных, а их произведения заносятся на пересечении строк и столбцов матри- цы. В нашем случае матрица произведений будет иметь вид табл. 4.2. Т а б л и ц а 4.2 Матрица произведений факторных нагрузок, используемая для расчета остатков корреляций Перемен- ные Фактор- ные на- грузки Zi zt z„ Zt 0,500 0,733 0,726 0,717 0,590 0,219 NNNNNN os ст w еэ i-i 1 0,500 0,733 0,726 0,717 0,590 0,219 0,2500 0,3665 0,3630 0,3585 0,2950 0,1095 0,5372 0,5321 0,5255 0,4324 0,1605 0,5270 0,5205 0,4283 ) 1589 0,5140 0,4230 0,1570 0,3481 0,1292 0,0479 Полученные произведения вычитаются из исходных коэффициен- тов корреляции. Рассчитанные остатки записываются в новую матрицу,которая называется матрицей первых остатков корреляций. В нашем примере эта матрица имеет вид табл. 4.3. Т а б л и ц а 4.3 Матрица первых остатков корреляций шести переменных Переменные Zt z2 Zz Zt z,, ^6 (0,150) —0,067 0,037 —0,061 —0,179 0,123 Z2 —0,067 (0,031) 0,036 0,009 0,000 —0,006 z3 0,037 0,036 (0,041) —0,033 0,008 —0,088 z4 —0,061 0,009 —0,033 (0,031) 0,122 —0,065 Z6 —0,179 0,000 0,008 0,122 (0,197) —0,145 Ze 0,123 —0,006 —0,088 —0,065 —0,145 (0,185) Суммы 0,003 0,003 0,001 0,003 0,003 0,004 Теперь нужно приступить к расчету нагрузок второго фактора-сум- мируя элементы столбцов для определения средней корреляции каждой переменной со всеми другими переменными. Оказывается, однако, что так поступать нельзя, поскольку сумма всех столбцов практически равна нулю в результате того, что положительные и отрицательные г уравновешиваются. Чтобы выяснить причины этого, нужно обра- титься к графической интерпретации проблемы. При этом следует учесть два обстоятельства. Во-первых, определяя нагрузки первого фактора, мы провели первую центроидную ось через центр тяжести (центроид) группы точек, являющихся концами векторов (рис. 4.1). Не предрешая вопрос о размерности задачи, можно сказать, что в ок- 74
рестности этого центра тяжести (SJ векторы (или соответствующие им дисперсии) дают в сумме ноль. Во-вторых, при расчете матрицы оста- точных корреляций из исходных величин вычитается та часть их дис- персии, которая связана с фактором Сх. На языке геометрии это озна- чает, что ось данного фактора устраняется из графика. Другими сло- вами, начало координат (О) перемещается вдоль первой центроидной оси к точке Sr. С учетом этого вторая центроидная ось С2, перпендикулярная к первой оси, также должна проходить через точку Slt которая теперь к тому же является началом координат. Если соединить пунктирными линиями концы векторов с новым началом координат (рис. 4.2), то получим менее длинные векторы, так как из расчета устранена диспер- сия, связанная с фактором Сх. Новая конфигурация этих векторов, однако, по-прежнему размещается вокруг первого центроида (являю- щегося сейчас одновременно и началом координат) так, что дисперсии, соответствующие векторам, взаимно погашаются. Рассчитывая матрицу первых остатков (табл. 4.3), мы пришли к та- кому же результату путем вычислений. Суммы элементов столбцов этой матрицы иллюстрируют ту же ситуацию, которая была представ- лена на рис. 4.2. Эти суммы являются в то же самое время критерием правильности выполненных расчетов. Если эти расчеты были верны, ни одна сумма не может превышать 0,010. Чтобы рассчитать нагрузки второго фактора, нужно каким-то способом получить положительные суммы элементов столбцов. Как это сделать? Оказывается, что этого можно достичь с помощью процедуры об- ращения алгебраических знаков в матрице остатков. Что это значит? Обратимся снова к графической иллюстрации задачи. Прежде всего необходимо подчеркнуть,что обращение алгебраических знаков всех коэффициентов корреляции данной переменной в соответствую- щих строке и столбце матрицы изменяет направление ее вектора на противоположное, не влияя на его длину. Изменение знаков не изме- няет абсолютные значения коэффициентов корреляции, в резуль- тате чего конфигурация векторов сохраняет свой основной смысл, так как изменяется лишь направление изменений переменных. Напомним, что на данном этапе анализа уменьшенные векторы рас- полагаются вокруг центроида (рис. 4.2), совпадающего с началом координат. Для определения нагрузок второго фактора или нового центроида, который на сей раз будет лежать на оси С2, нужно изме- нить знак некоторых переменных так, чтобы все точки, соответствую- щие окончаниям векторов, находились по одну сторону первого цент- роида. Результаты этой операции представлены на рис. 4.3, где новые векторы изображены пунктирными линиями. Теперь новый центроид (S2) лежит на оси С2. В результате получаем положительные суммы столбцов матрицы остаточной корреляции и можем определить на- грузки второго фактора. Здесь необходимо обратить внимание на ин- тересное явление, заключающееся в том, что разброс точек вокруг 75
второго центроида намного меньше, чем вокруг первого, так как из исходных корреляций устранена та часть, которая вызывалась пер- вым фактором. Забегая немного вперед, можно отметить, что разброс точек вокруг каждого нового «центра тяжести» будет уменьшаться по мере того, как последовательное выделение факторов уменьшает общ- ность, содержащуюся в исходных корреляциях. Этот процесс схема- тично представлен на наших графиках. Процедура обращения алгебраических знаков весьма трудоемка и требует большого внимания. Обращение знаков в столбце перемен- ной требует обращения знаков в соответствующей строке. Существуют различные способы выполнения этой операции. Мы опишем один из них, часто применяемый на практике. 1. Начнем с расчета алгебраических сумм элементов по столбцам, опуская элементы главной диагонали. Результаты записываем в стро- ку, следующую за строкой 20. Обозначим ее 2г0. Складываем суммы столбцов и результат (22г0) записываем в последней клетке указан- ной строки (табл. 4.4). В нашем примере он составит —0,618. 2. Берем столбец с наибольшей отрицательной суммой (это будет столбец Z5). Переписываем эту сумму в следующей строке с положи- тельным знаком. Эту строку обозначаем номером столбца, элементы которого меняют знак на противоположный. Одновременно отмечаем звездочкой номера столбца и строки, элементы которых меняют зна- ки на противоположный. 3. Все элементы новой строки, за исключением того, который уже определен как наибольшая отрицательная сумма по столбцу с обратным знаком (Z5), отыскиваются следующим образом: к сумме соответствующего столбца добавляется с противоположным знаком удвоенное значение элемента того же столбца, стоящего на пересе- чении с «обращаемой» строкой. Окончательный результат записы- вается в строке, обозначенной «Столбец 5». Например, значение первого элемента в строке, обозначенной «Столбец 5», получаем, 76
Таблица 4.4 Обращение знаков в матрице первых остатков корреляций шести переменных и расчет нагрузок второго фактора Пере- мениые Zi у* Z3 zl z„ X. 1 2 3 4 5 6 7 8 0,179 + _— + + Z1 (0,150) (—) 0,067 (+) 0,037 (—) 0,061 (—) 0,179 0,123 0,003 + 0,067 + »z2 (—) 0,067 (0,031) 0,036 0,009 0,000 (—) 0,006 0,003 — 0,088 + *Z3 ()-) 0,037 0,036 (0,041) —0,033 0,008 (—) 0,088 0,001 + 0,122 + *z4 (—) 0,061 0,009 —0,033 (0,031) 0,122 (—) 0,065 0,003 + 0,179 + *Z5 (—) 0,179 0,000 0,008 0,122 (0,197) (—) 0,145 0,003 4- + + + 0,145 Ze 0,123 (—) 0,006 (-) 0,088 (—) 0,065 (—) 0,145 (0,185) 0,004 0,003 0,003 0,001 0,003 0,003 0,004 —0,147 —0,028 —0,040 —0,028 —0,194 —0,181 SSr 0 = =—0,618 Столбец 5 0,211 —0,028 —0,056 —0,272 0,194 —0,109 0,158 » 4 0,333 —0,046 0,010 0,272 0,438 0,239 1,246 » 2 0,467 0,046 —0,062 0,290 0,438 0,251 1,430 » 3 0,393 0,118 0,062 0,224 0,454 0,427 1,678 Yr 0,572 0,185 1,50 0,346 0,633 0,572 0,365 —0,118 —0,095 —0,220 —0,404 0,365 T = 2,458 У T = 1,56781; - -0,63783. Критерий 1 т.—— = УТ =1,5677, Критерий SC2 = 1,567. удваивая величину, стоящую на пересечении строки 5 и столбца 1 (—0,179), изменяя ее знак и складывая с итогом столбца 1, т. е.: —0,147 + 2 (0,179) = 0,211. 4. Рассчитав указанным способом все элементы новой строки, оп- ределяем их сумму и записываем ее в последней клетке строки. Это дает нам важный критерий: сумма новой строки должна быть равна сумме предшествующей строки плюс четырехкратная сумма столбца, элементы которого изменили знак на противоположный. Для строки «Столбец 5» критерий будет следующим: —0,618 4 (0,194) = 0,158, 77
5. Теперь отыскивается следующий столбец с наибольшей отри- цательной суммой. В нашем примере это будет столбец 4. Повторяем процедуру, описанную в пунктах 1—4, используя при этом изменив- шиеся итоги столбцов, записанные в предшествующей строке. В столб- цах, элементы которых уже поменяли знаки (т. е. в тех, которые от- мечены звездочкой), перед добавлением удвоенной величины они не меняются (пункт 3). Если процедура обращения знаков требует из- менения знаков элементов какого-либо столбца и соответствующей строки более чем один раз, то в этом случае при первом и всех даль- нейших нечетных изменениях знаков знак удвоенного значения дол- жен меняться (пункт 3). При втором и всех четных изменениях зна- ков знак удвоенного значения не изменяется. Чтобы легче ориен- тироваться в номерах столбцов, элементы которых меняют знаки, нужно подчеркивать последовательные суммы столбцов, элементы которых меняют знаки на противоположный. 6. Процесс изменения знаков повторяется до тех пор, пока все суммы не будут положительными (или нулевыми). В нашем примере для получения положительных сумм потребовалось изменить знаки элементов столбцов 5, 4, 3 и 2. Критериями правильности вычисле- ний, о которых шла речь в пункте 4, являются для последующих строк такие суммы: 0,158 + 4(0,272) = 1,246; 1,246 + 4 (0,046) = 1,430, 1,430 4- 4 (0,062) = 1,678. 7. Меняем алгебраические знаки в матрице остатков. Делается это следующим образом: а) меняются на противоположные знаки всех коэффициентов в об- ращенных строках за исключением тех элементов, которые лежат на пересечении с обращаемыми столбцами; б) изменяются знаки всех коэффициентов в обращаемых столбцах за исключением тех элементов, которые находятся на пересечении с об- ращаемыми строками. В нашей матрице новые знаки указаны над первоначальными, за- ключенными в скобки. Чтобы приступить к определению нагрузок второго центроидного фактора, необходимо учесть общности, запи- санные на главной диагонали матрицы остатков (табл. 4.4). Эти вели- чины, заключенные в скобки (табл. 4.3 и 4.4), были рассчитаны так же, как и все другие остаточцые корреляции. Теперь их нужно заменить коэффициентами с максимальной для данного столбца абсолютной величиной, приписывая им положительный знак. Новые значения за- писаны жирным шрифтом над величинами в скобках. Такой метод оценки общности использовался уже при определении нагрузок пер- вого фактора. После этого новые значения общности добавляются к итогам столб- цов, полученных по окончании процесса изменения знаков и записан- ных в строке, обозначенной номером последнего обращаемого столб- 78
(столбец 3, табл. 4.4). Результаты сложения записаны в строке Sr. Следующие действия аналогичны описанным при расчете первого фактора: 1. Складываются суммы столбцов. Результат, обозначаемый бук- вой Т, записывается справа от таблицы. В нашем случае он состав- ляет 2,458. Затем определяется величина [Т = 1,56781. 2. Итоги столбцов делятся на УТ для определения факторных нагрузок. Этой операции соответствует формула C2a = Sro^J, (4.2) где С2а — нагрузка второго фактора у переменной а; Ъга — итог столбца переменной а; Т — общая сумма всех коэффициентов матрицы (сумма итогов по столбцам). Рассчитанные нагрузки второго фактора записываются в строку С2 (табл. 4.4). 3. Вычисляется критерий Т = 1,5677, который должен быть равен )Т = 1,5678. Вторым критерием является сумма факторных нагрузок SC2 = 1,567, которая должна быть приблизительно равна |/7 = 1,5678. Критерии записываются справа под таблицей. Остается еще определить алгебраические знаки нагрузок второго фактора. Эти знаки зависят от описанной процедуры. Здесь нужно соблюдать следующие правила: а) переменная, которая обращалась нечетное число раз, будет в данной матрице остатков корреляции иметь знак, противоположный ее знаку при предыдущем факторе; б) знак переменной, которая не обращалась или обращалась чет- ное число раз, будет таким же, что и знак при предыдущем факторе. Таким образом, в случае четырех центроидных факторов переменная, знак которой менялся один раз в первой и один раз во второй матри- це остатков, будет иметь такую систему знаков: Фактор Переменные 1 II III IV + — + + В нашем примере все нагрузки первого фактора были положитель- ными, так как итоги всех столбцов в исходной корреляционной мат- рице были положительными и без процедуры изменения знаков. (Если в первой корреляционной матрице получаются отрицательные итоги столбцов, нужно использовать процедуру изменения знаков уже при определении первого фактора. В этом случае действует правило, в соответствии с которым нагрузки переменных, знаки которых были изменены, будут отрицательными, а нагрузки других переменных — положительными.) С учетом приведенных правил знаки нагрузок 79
фактора С2 в столбцах 1 и 6 будут положительными, так как знаки этих переменных не изменялись, а знаки нагрузок в столбцах 2, 3, 4 и 5 будут отрицательными, так как их знаки изменились. Определением алгебраических знаков всех нагрузок второго фак- тора заканчивается процедура его выделения. Затем вычисляются корреляции, остающиеся после выделения второго фактора. Процеду- ра здесь аналогичная, однако нужно обращать внимание на алгеб- раические знаки. Элементы первой матрицы остаточных корреляций сохраняют те знаки, которые они получили по окончании процедуры изменения знаков (табл. 4.4). При вычислении произведений фактор- ных нагрузок знаки всех факторных нагрузок принимаются положи- тельными, что дает положительные произведения. Эти положительные произведения вычитаются из остатков корреляции, получившихся после выделения первого фактора. Вычисленные величины записы- ваются в новую «матрицу вторых остатков корреляций» (табл. 4.5), после чего можно приступить к расчету нагрузок третьего фактора. Эта процедура, так же как и расчет всех следующих факторов, осу- ществляется аналогично вышеизложенной: весь цикл охватывает из- менение алгебраических знаков, определение общности, суммиро- вание элементов столбцов и расчет факторных нагрузок. Операции такого цикла показаны в табл. 4.5. Нагрузки третьего фактора записаны в ней в строке С3. Знаки нагрузок определены в соответствии с вышеуказанными правилами. Вычисленные нагрузки выписаны в факторной матрице (табл. 4.6). Остаточные корреляции после расчета нагрузок третьего фактора приведены в табл. 4.7. Как видим, остатки в строке 20 этой таблицы снова близки к нулю. Мы уже знаем, что это свидетельствует о правильности расчетов. В соответствии с правилом сумма элементов любого столбца не может превышать 0,010, если проведенные расчеты были достаточно точными. В нашем примере итоги всех столбцов удовлетворяют этому условию. Теперь можно сформулировать важный вопрос: когда следует прекратить выделение очередных факторов, т. е. когда можно быть уверенным, что полученное число осей достаточно полно объясняет коэффициенты корреляционной матрицы? В некоторых случаях для ответа на этот вопрос достаточно одного взгляда на матрицу остатков. Если все ее элементы очень малы, прак- тически равны нулю, то сразу можно увидеть, что весь запас корреля- ции исчерпан. Однако часто ситуация более сложна и трудно решить, вызваны ли рассчитанные остатки какими-то другими, пусть незначи- тельными, но реальными факторами или же они объясняются просто ошибками наблюдений и округлением в процессе расчетов. Сущест- вуют различные методы, с помощью которых можно определить, на- сколько исчерпан факторный запас корреляционной матрицы. Изло- жение всех этих методов и их математических основ выходит за рамки книги. Поэтому мы ограничимся изложением последовательных опе- раций по одному из таких методов, известному под названием крите- рия Саундерса. 30
Таблица 4.5 Изменение знаков в матрице вторых остатков корреляции шести переменных и вычисление нагрузок третьего фактора Пере- менные Zj Z, zt Z„ Ze 1 2 3 4 5 6 7 8 тЧ С4 СО ** КО СО N N N N N N • 0,072 (0,046) (+) 0,024 + (—) 0,072 + (—) 0,019 0,032 + (—) 0,010 (+) 0,024 0,047 (0,053) 0,025 + (—) 0,016 + (—) 0,047 —0,037 + (—) 0,072 0,025 0,072 (0,079) + (—) 0,054 + (-) 0,030 0,054 —0,019 + (—) 0,016 + (—) 0,054 0,054 (0,074) 0,033 + (—) 0,015 0,032 •ф- (—) 0,047 + (-) 0,030 0,033 0,047 (0,016) + (—) 0,002 + (—) 0,010 —0,037 0,054 (—) 0?015 + (-) 0,002 0,054 (0,012) Ео 0,001 0,002 0,002 0,003 0,002 0,002 Sr q —0,045 —0,051 —0,077 —0,071 —0,014 —0,010 SSr0 = =—0,268 Столбец 3 » 6 » 2 0,099 0,119 0,071 —0,101 —0,027 0,027 0,077 0,185 0,235 0,037 0,067 0,099 0,046 0,050 0,144 —0,118 0,118 0,044 0,040 0,512 0,620 Sr 0,143 0,074. 0,307 0,153 0,191 0,098 с3 0,1454 7=0,966 Критерий Критерий 0,0752 1/7 = T'Vf ~ 2С3=0,9 0,3122 0,983; —1 =0,9824. 822. —0,1556 - — 1.017 —0,1942 —0,0996 Таблица 4.6 Матрица центроидных факторов Переменные Факторы I П Ш 1 2 3 4 1 0,500 0,365 0,145 2 0,733 —0,118 0,075 3 0,726 —0,095 0,312 4 0,717 —0,220 —0,155 5 0,590 —0,404 —0,194 6 0,219 0,365 —0,099 81
Таблица 4.7 Матрица третьих остатков корреляций шести переменных Переменные Zi X Z„ zt 21 (0,051) —0,035 0,027 —0,041 0,004 —0,004 z2 —0,035 (0,041) 0,001 0,004 0,032 —0,044 z3 0,027 0,001 (—0,025) 0,005 —0,030 0,023 Z* —0,041 0,004 0,005 (0,030) 0,002 0,000 z3 0,004 0,032 —0,030 0,002 (0,009) —0,017 ze —0,004 —0,044 0,023 0,000 —0,017 (0,044) 20 0,002 0,001 0,001 0,000 0,000 0,002 Число обследуемых лиц Л’=133 I. Возводим в квадрат и складываем остатки, полученные после выделения k-ro фактора, опуская элементы главной диагонали. По- 2п лученную величину умножаем на __ для приведения ее в соот- ветствие с полной матрицей (п — число переменных). Вычисленную величину обозначим А. 2. Делим разницу между числом переменных и числом уже выде- ленных факторов на число переменных и результат возводим в квад- рат. Обозначим его В. 3. Возводим в квадрат все факторные нагрузки, включая нагруз- ки k-ro фактора, и суммируем их (число факторных нагрузок равно k X п). Результат вычитаем из и, и полученную величину снова воз- водим в квадрат. Результат делим на N, т. е. на число единиц наблю- дения в исходной совокупности. Результат обозначаем С. 4. Если окажется, что А меньше произведения В'хС, выделение факторов прекращается. Если А < В X С, выделяется следующий фактор, после чего описанная процедура проверки повторяется. Не предрешая вопроса о том, выделено ли в нашем примере доста- точное число факторов, предоставляем читателю в качестве упражне- ния возможность использования этого метода для последней матрицы остатков (табл. 4.7). Представляет также интерес проблема минималь- ного числа переменных (и), необходимого для однозначного определе- ния. т факторов. Ответ на этот вопрос дает формула Тэрстоуна 2m + 1 +~|/8m+ 1 (4.3) 2 В приведенной ниже таблице даны значения и, соответствующие различным т: m 1 2 3 4 5 6 7 8 9 10 « 3 5 6 8 9 10 12 13 14 15 82
В нашем примере с шестью переменными можно определить не более трех факторов. Преобразуя приведенную формулу для получе- ния tn, определяем наибольшее число факторов, которые могут быть однозначно определены в случае п переменных: 2л 4-1 — 1/вп 4-1 .. ,, m = —-----—----. (4.4) На практике целесообразно оперировать числом переменных, пре- вышающим минимально необходимое для определения данного числа факторов. 6. НЕКОТОРЫЕ СПЕЦИФИЧЕСКИЕ ПРОБЛЕМЫ ЦЕНТРОИДНОГО МЕТОДА а. МЕТОДЫ ОПРЕДЕЛЕНИЯ ОБЩНОСТИ Необходимо подчеркнуть прежде всего, что описанная выше про- цедура является лишь исходным, основным вариантом центроидного метода. Существует и ряд других разновидностей этого метода, однако их подробное изложение не входит в нашу задачу. К ним относится, например, довольно простой и сжатый метод группировки и более сложный групповой метод1. К важным процедурным вопросам изложенного здесь варианта центроидного метода относится прежде всего определение элементов главной диагонали. Значение общности, записываемое на главной диагонали корреля- ционной матрицы, выражает ту часть корреляции переменной с самой собой, которую можно приписать влиянию общих факторов. Если бы на главной диагонали записывались корреляции каждой из перемен- ных с самой собой с учетом специфической дисперсии и дисперсии, обусловленной ошибкой, то эти корреляции были бы равны 4-1,00. Однако все другие корреляции в каждом столбце корреляционной матрицы выражают взаимосвязь между парами переменных лишь в Toil степени, в какой она обусловлена общими факторами, так как предполагается, что специфическая дисперсия двух переменных и дис- персия, обусловленная ошибкой, не коррелируют друг с другом. В корреляционной матрице, подготовленной для анализа, следует записать на главной диагонали аналогичные коэффициенты, в том смысле, что они являются показателями лишь общих изменений. Тог- да, как мы знаем, корреляционная матрица становится редуцирован- ной. Трудность заключается в том, что, приступая к анализу, мы не знаем величин h2, ибо они не определяются в процессе эксперимента. В то же время эти величины для нас небезразличны, так как они вли- 1 Метод группировки и групповой метод не могут рассматриваться как ва- рианты центроидного метода. Это самостоятельные методы факторизации, при- меняющиеся, как правило, для проверки содержательных гипотез. —Прим. ред. S3
яют на сумму элементов столбца и в результате на величину фактор- ных нагрузок и даже на число факторов, которое удается выделить. Поэтому нужно стремиться к тому,чтобы уже в начале процедуры была установлена такая величина элементов главной диагонали, которая была бы максимально близкой к их истинным значениям. Та величи- на h2 является истинной, которую можно вычислить путем суммиро- вания квадратов факторных нагрузок. Помимо того, что эта операция осуществима лишь в конце процесса выделения факторов, получае- мая этим путем величина общности будет надежной только тогда, когда мы располагаем точно рассчитанными факторными нагрузками. Для вычисления же точных факторных нагрузок нужно начинать анализ с правильно определенных значений Л2. Таким образом, по- лучается нечто похожее на заколдованный круг. Поэтому нужно искать методы, позволяющие максимально точно оценить исходные элементы главной диагонали корреляционной матрицы. В литературе по факторному анализу много внимания уделяют этой проблеме. Можно встретить различные мнения о цели, к которой нужно стремиться при оценке элементов главной диагонали. Некото- рые авторы считают, что целью должно быть определение таких ве- личин Л2, которые дают минимально возможное число факторов для данной матрицы. В соответствии с другим мнением речь идет о полу- чении минимально возможных значений h2 в целях уменьшения до минимума области изменений, обусловленных общими факторами. В этом случае обязательно преувеличиваются специфические измене- ния, что нежелательно, так как они немного говорят о структуре фак- торов, скрытой за системой. парных корреляций. Самым правиль- ным представляется подход, в соответствии с которым главной целью является определение таких значений Л2, которые облегчают выделе- ние факторных нагрузок и факторов, содержащихся в корреляцион- ной матрице и отражающих какую-то действительную структуру. Учитывая необходимость сокращения расчетных выкладок, можно принять, что это будет такое число факторов, которое одновременно будет минимально необходимым для объяснения анализируемых кор- реляций. Кроме того, необходимо помнить, что слишком большое за- нижение или завышение величин h2 может привести к существенным ошибкам и определению фиктивных нагрузок. Перейдем теперь к краткому описанию некоторых методов оценки величин h2. 1. Наиболее простым и распространенным методом предваритель- ной оценки элементов главной диагонали является метод наибольшей корреляции. Он заключается в том, что на главной диагонали записы- вается с положительным знаком наибольший коэффициент корреляции в данном столбце безотносительно к его исходному алгебраическому знаку. Этот способ и был использован в примере с шестью тестами. Он основывается на том факте, что длина вектора может быть определена с наибольшим приближением через его проекцию на вектор, являю- щийся его ближайшим соседом. Специалисты высказывают ряд сомне- ний в точности этого метода в особенности применительно к небольшим матрицам, содержащим до 10 переменных, так как в столбцах с отно- 84
сительно большим числом низких коэффициентов корреляции оценка общности может оказаться завышенной, и наоборот, в столбцах с боль- шим числом высоких коэффициентов — заниженной. Существует спо- < )б корректировки исходных значений /г2, о котором мы уже упомина- ли и который состоит в сравнении исходных значений с рассчитанны- ми на основе факторных нагрузок по окончании процесса выделения факторов. В случае больших различий вся процедура повторяется, причем анализ начинается с рассчитанных значений /г2. Так посту- пают до тех пор, пока величины h2 не стабилизируются на требуемом уровне точности. Этот способ при больших матрицах весьма трудоемок. 2. Сходный метод был предложен Бартом (С. L. Burt. Factors of the mind, London, 1940, University of London Press.) Его идея состоит в том, что для переменных, у которых среднее значение коэффициентов корреляции в столбце высоко, принимается общность, несколько пре- вышающая наибольший г этого столбца, и наоборот, для переменных с низким средним значением коэффициентов корреляции эта область оценивается несколько ниже наибольшего г. Как видим, здесь также применяется величина наибольшего коэффициента корреляции в дан- ном столбце, только в несколько модифицированном варианте. 3. В качестве более точного, но зато и более трудоемкого способа можно привести метод малого центроида. Он требует следующих опе- раций. а) для каждой переменной строится корреляционная матрица 4x4, включающая как саму изучаемую переменную, так и три другие переменные, с которыми она теснее всего связана. Затем на главной диагонали записываются наибольшие корреляции в каждом столбце. Элементы h2 определяются по формуле Й2 = М, где — сумма элементов первого столбца, S7 — сумма элементов всей матрицы 4x4. Операция выполняется для каждой переменной; б) вычисленные оценки общности записываются по главной диа- гонали исходной корреляционной матрицы. Табл. 4.8 иллюстрирует расчет h2 указанным методом для пере- менной 1 для матрицы из шести переменных (табл. 4.1). Как видим, полученное значение существенно отклоняется от принятого в нашем примере, который использует первый из описанных методов. Необхо- димо отметить, что второй метод считается относительно наиболее точным. Другие методы определения величины h2 можно найти в ра- боте Тэрстоуна [203], в которой описано 12 различных методов. Рассмотрим кратко еще одну проблему, решение которой должно показать, чем нужно руководствоваться при выборе метода оценки величин h2. Здесь можно отметить влияние таких обстоятельств, как, например, размер корреляционной матрицы, вариант используемого метода выделения факторов и т. д. При очень больших матрицах влия- ние ошибок оценки элементов/г2 незначительно с учетом больших зна- (4.5) 85
Т а б л и ц а 4.8 Переменная 1 Переменные 1 2 3 4 1 0,400 0,400 0,299 0,297 1,396 2 0,400 0,568 0,568 0,487 2,023 3 0,299 0,568 0,568 0,534 1,969 4 0,297 0,487 0,534 0,534 1,852 1,396 2,023 1,969 1,852 27 = 7,240 i)2_ (1.396] 2 1,948 — = = 0,269 XI г 7,240 7,240 чений сумм элементов отдельных столбцов. Если для малых матриц (10—12 переменных) применяются упрощенные методы (например, описанные выше два способа), то нужно проверить результаты путем многократного повторения процесса выделения факторов, о чем мы уже говорили выше. При небольших матрицах этот способ, несмотря на трудоемкость, все же может применяться. В случае больших мат- риц (40—100 переменных) можно без всякого опасения применять пер- вый или второй метод. Третий метод менее оправдан, особенно в слу- чае основной центроидной процедуры, так как он годится скорее для таких способов выделения факторов, которые требуют предваритель- ного выделения связок переменных. К этим способам относится, на- пример, групповой метод. Для него существен еще один важный мо- мент, свидетельствующий в пользу третьего метода оценки h2. Дело в том, что здесь отсутствует возможность проверки величин h2 путем последовательных приближений, в результате чего нужно использо- вать такие способы, которые позволяют наиболее точно оценивать эти величины для каждой переменной перед началом факторного анализа. б. ИЗМЕНЕНИЕ ЗНАКОВ ПЕРЕМЕННЫХ Процесс изменения знаков переменных имеет решающее значение для центроидного метода. Он является необходимой операцией с мат- рицами остатков корреляций при выделении следующих факторов. На практике иногда случается, что уже первая корреляционная матрица, полученная экспериментальным путем, дает отрицательные итоги не- которых столбцов. В этом случае работа должна начинаться с изме- нения знаков соответствующих переменных. Существует несколько спо- собов осуществления такой операции, дающих однозначный результат, т. е. получение максимально возможных положительных сумм во всех столбцах матрицы. Различным подчас бывает процесс изменения зна- ков и последовательность переменных, что, однако, не имеет решающего влияния на результаты. В общем можно утверждать, что в этом смысле 86
Все способы изменения знаков одинаково хороши. Речь идет, однако, о другом. Мы уже знаем, что указанная операция довольно трудоемка и в ходе ее выполнения легко сделать ошибку. Поэтому нужно выбрать наиболее простой способ, который хорошо поддается проверке и не требует большого внимания. Изменение знаков переменных в мат- рице требует дополнительных столбцов для записи измененных зна- ков. Для каждой переменной нужно изменять знак по строке и столбцу одновременно, что вызывает различные трудности. Наиболь- шие трудности возникают тогда, когда нужно много раз изменять знаки коэффициентов корреляции какой-либо переменной. В приводившемся примере центроидного метода с шестью перемен- ными был использован один из самых надежных методов изменения зна- ков. Однако он требует довольно сложных расчетов. В качестве допол- нения опишем более простой метод. Детально разберем последователь- ные операции по этому методу, иллюстрируя их на конкретном число- вом примере. 1. Начнем с вычеркивания или помещения в скобки элементов Л2, исчисленных как остаточные корреляции. На их месте или над ними записываем новые значения А2, оцененные по матрице остатков. Вер- немся к матрице первых остатков, которая была использована в при- мере анализа шести тестов центроидны.м методом (табл. 4.9). Исполь- зуем ее еще раз для иллюстрации сокращенного метода изменения знаков. 2. Вычисляем алгебраические суммы элементов всех столбцов, не учитывая величин Л2, и записываем их в строке 5. 3. Уменьшаем наполовину все элементы строки S, изменяем их знаки на противоположные и результаты записываем в строке, обо- значенной — yS. 4. В этой строке отыскиваем наибольшую положительную величину. Столбец, которому она соответствует, первым подвергнется процессу обращения знаков, так как в самой матрице он характеризуется на- ибольшим числом отрицательных коэффициентов корреляции. В нашем примере это будет столбец Z5. 5. Строку этой переменной отмечаем звездочкой и складываем ее со строкой — -Is. При сложении не учитываются элементы Л2. Результа- ты записываются в строке +Z5. Далее волнистой линией подчеркивает- ся коэффициент, лежащий на пересечении обращаемого столбца и строки —S. Слева от него вниз проводим волнистую линию. 6. В вычисленной строке -\-Z5 снова отыскиваем наибольшую положительную величину (0,1360), подчеркиваем ее и помечаем звез- дочкой строку матрицы, соответствующую столбцу, в котором находится эта величина. В нашем примере это будет строка Z4. Скла- дываем ее со строкой 4~Z5. Результат записывае.м в строке +Z4. 7. В строке +Z4 снова определяем наибольшее положительное зна- чение, не учитывая тех столбцов, элементы которых уже изменили 87
Таблица 4.9 Сокращенный метод обращения знаков переменных Пере- менные zt zl 4 4 4 z. 1 2, 3 4 5 6 7 0,179 4 (0,150) -0,067 0,037 —0,061 —0,179 0,123 0,067 % —0,067 (0,031) 0,036 0,009 0,000 —0,006 0,088 *z3 0,037 0,036 - (0,041) —0,033 0,008 —0,088 0,122 *Z4 —0,061 0,099 —0,033 (0,031) 0,122 —0,065 0,179 *z5 —0,179 0,000 0,008 0,122 (0,197) —0,145 0,145 Ze 0,123 —0,006 —0,088 —0,065 —0,145 (0,185) s —0,147 —0,128 —0,040 —0,028 —0,194 —0,181 — -S 0,0735 0,0140 0,0200 0,0140 | 0,0970 0,0905 2 —0,1055 0,0140 0,0280 0,1360 0,0970 —0,0545 •^pZ4 —0,1665 110,0230 —0,0050 0,1360 0,2190 —0,1195 4-Z2 —0,2335 |0,0230 | 0,0310 0,1450 0,2190 —0,1255 -f-Z3 = B —0,1965 j0,0590 j 0,0310 0,1120 0,2270 —0,2135 —2B 0,393 (—) 0,118 (—) 0,062 (—) 0,224 (—) 0,454 0,427 2B-±№ 0,572 —0,185 —0,150 —0,346 —0,633 0,572 Знак и которые помечены вертикальными волнистыми линиями. Пов- торяем описанную процедуру. В нашем примере наибольшей положи- тельной величиной будет 0,0230. 8. Повторяем суммирование строк до тех пор, пока все значения в последней из вычисленных строк, не учитывая отмеченных столбцов, элементы которых уже изменили знак, будут отрицательными. В на- шем примере последней будет строка +Z3. Обозначим ее В. 9. Удваиваем все элементы строки В и меняем их алгебраические знаки. Результат записываем в строке —2В, элементы которой пред- ставляют собой суммы столбцов после изменения знаков переменных. 10. Элементы строки —2В суммируем с заново исчисленными зна- чениями/!2, которые всегда считаются положительными. Элементы стро- ки —2 В берутся с таким знаком, который был получен после последне- го действия. Эти знаки положительные. В результате получаем величи- 88
ны, необходимые для расчета значения Т и факторных нагрузок. В на- шем примере они согласуются с теми, которые были получены выше другим методом (табл. 4.4). Как видим, описанный метод привел к конечному результату без записи измененных знаков в самой матрице, которая сохраняет свой первоначальный вид. Кроме того, упрощение процедуры снижает воз- можность ошибок. в. ПРОВЕРКА РАСЧЕТОВ В ЦЕНТРОИДНОМ МЕТОДЕ Поскольку речь зашла об ошибках, целесообразно уделить этой проблеме еще немного внимания. Ошибки расчетов всегда нежелатель- ны в статистической работе, их влияние особенно пагубно в факторном анализе. Представим себе, что при выделении какого-либо фактора, на- пример десятого, оказывается, что была совершена ошибка в расчете при определении еще второго или третьего фактора. В этом случае большая работа проделана напрасно, так как весь процесс нужно начинать сна- чала. Каждая мелкая ошибка расчета, например при суммировании эле- ментов столбца, влияет на общую сумму всех коэффициентов данной матрицы (Т) и в результате на все факторные нагрузки. Отсюда ясно, что нужно использовать все средства, чтобы свести к минимуму воз- можность ошибок. Не говоря уже о необходимости максимальной стара- тельности и аккуратности, нужно умело пользоваться различными тех- ническими средствами, например счетными машинами, которые не только уменьшают риск ошибок, но и ускоряют работу. Знакомство с такими машинами необходимо для каждого исследователя-при- кладника, стремящегося применить факторные методы. Широкие пер- спективы открывают здесь возможности использования ЭВМ. Важно также скрупулезно использовать все возможные способы проверки правильности расчетов. Мы уже говорили о них в процессе из- ложения процедуры определения факторов центроидным методом. Здесь мы напомним только два наиболее часто употребляемых критерия. При суммировании элементов столбцов матрицы необходимо одновременно суммировать все строки. Итоги столбцов записываются в нижней стро- ке матрицы, суммы строк — в последнем столбце. Соответствующие суммы должны быть равны. Общую сумму коэффициентов всей матри- цы (Т) можно проверить, вычисляя ее один раз как сумму столбцов и Другой раз как сумму всех строк. Определив факторные нагрузки, мож- но применить другой критерий: сумма нагрузок должна быть равна \'Т. В качестве более сложного и трудоемкого критерия можно прибегнуть к воссозданию' исходных коэффициентов корреляции на основе фактор- ных нагрузок. Для этой цели можно использовать факторные нагруз- ки как до, так и после вращения. Эта процедура будет описана в сле- дующей главе, посвященной вращению системы координат.
Г лава пятая ВРАЩЕНИЕ СИСТЕМЫ КООРДИНАТ 1. ВСТУПИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Завершив определение факторных нагрузок, запишем полученные величины в специальную факторную матрицу с учетом алгебраических знаков, полученных в процессе их изменения. Таблица 5.1 Факторная матрица шести переменных Переменные Факторы h2 Отклонение I П Ш расчетная предпо- лагаемая 1 0,500 0,365 0,145 0,404 0,400 0,004 2 0,733 —0,118 0,075 0,556 0,568 0,012 3 0,726 —0,095 0,312 0,633 0,568 0,065 4 0,717 —0,220 —0,155 0,586 0,545 0,041 5 0,590 —0,404 —0,194 0,548 0,545 0,003 6 0,219 0,365 —0,099 0,189 0,232 0,043 Таблица содержит два столбца с общим заголовком /г2. Это уже из- вестное нам обозначение общности. Во втором из них записаны оценки, использовавшиеся в процессе расчета факторных нагрузок. Вспомним, что в качестве такой оценки брался наибольший коэффициент корреля- ции в данном столбце. В первом из двух указанных столбцов приведены значения, рассчитанные как суммы квадратов факторных нагрузок. 90
Мы уже знаем, что эта сумма квадратов равна квадрату век- тора теста. Для двух общих факторов это вытекает просто из теоремы Пифагора, так как вектор является гипотенузой прямоугольного треугольни- ка, катеты которого представ- ляют собой факторные нагруз- ки. Этот принцип действите- лен и при большем количест- ве факторов или осей в про- странстве, в котором разме- щается система векторов. Таб- лица 5.1 показывает, что меж- ду рассчитанными и приняты- ми . для анализа значениями h2 существуют некоторые раз- личия, показанные в послед- нем столбце таблицы. Наи- большая разница составляет 0,065. Не будем здесь рассматривать вопрос о том, насколько точными оказались расчетные значения Л2. В принципе, если разница двух указанных величин значительна, то, как мы уже знаем, нужно повторить всю процедуру анализа, прини- мая за основу вычисленные значения. Построив факторную матрицу, можно вычертить систему векторов, соответствующих переменным. Так как было выделено три фактора, чертеж будет трехмерным. Это, однако, не доказывает, что трех факто- ров вполне достаточно для объяснения всех корреляций исходной мат- рицы. Просто трехмерный случай удобен для изложения процедуры вращения. Легче всего начертить систему векторов на плоскости: откладываем значения факторных нагрузок на осях координат, полу- чая этим путем проекции векторов, которые одновременно определяют однозначно их положение. Трехмерный случай несколько сложнее. Система векторов будет теперь находиться в пространстве, некоторые из них уже не лежат на плоскости, а устремлены вверх или вниз, как бы прокалывая страницы открытой книги. Пространственную сис- тему можно, правда, изобразить на перспективном рисунке, но такой рисунок часто трудно понять, так как векторы могут совпадать и по крайней мере одна ось изображается в укороченной перспективе, что не позволяет правильно исчислять длины проекций и векторов. Попыт- ка графического представления шести переменных иллюстрируется рис. 5.1. Как видим, этот рисунок не дает полного представления о простран- ственном размещении векторов. Пунктирные вспомогательные линии, определяющие три проекции (нагрузки) вектора (на рисунке это сдела- но для вектора 1), для всех векторов настолько усложнили бы рисунок, что он утратил бы свои иллюстративные свойства. 91
К счастью, существует способ графического изображений векторов и их факторных нагрузок в одной плоскости даже в трехмерном случае. Это можно сделать, учитывая каждый раз одновременно только две оси. По существу, это тот же способ, с помощью которого на плоских рисун- ках изображаются всякие тела, трехмерные фигуры, например здания, когда дается их вид спереди, сбоку и сверху. В верхней части рис. 5.2 даны три пространственных чертежа, на которых заштрихованы плоскости, соответствующие последователь- ным двумерным представлениям. В нижней части даны три рисунка, на которые как бы распадается трехмерная система векторов. По мере роста числа факторов (осей) число необходимых рисунков будет увели- чиваться в соответствии с формулой т = —1-> где т—число ри- сунков, а п — число факторов. Рисунки вычерчиваются таким образом, что факторные нагрузки из каждой строки факторной матрицы прини- маются в качестве координат соответствующего вектора, причем всегда одновременно берется два столбца. Удобно представлять векторы точ- ками их концов. При этом имеется в виду, что вектор имеет длину от начала координат до этой точки. В дальнейшем будем пользоваться этим способом графического изображения. Важно помнить, что сумма квадратов факторных нагрузок дает лишь квадрат той компоненты вектора, которая соответствует общности, другими словами, квадрат длины проекций вектора на пространство общих факторов. Строя вектор на основе нагрузок общих факторов, мы опускаем ту его часть, которая соответствует специфичности и дис- персии, обусловленной ошибкой. Если нужно довести длину векторов до 1, это может быть легко сделано добавлением специфичности, свой- Рис. 5.2 92
ственной каждой переменной. Нагрузки специфичных факторов мож- но определить просто, вычитая из единицы рассчитанное для каждой переменной значение общности и извлекая квадратный корень из полу- ченной величины. Приведем в качестве примера таблицу, содержащую указанные расчеты. Определение нагрузок специфичных факторов для шести переменных Переменные 1 2 3 4 5 6 г т* '5 7» II 1 cP 1,000 —0,404 0,596 0,7721 1,000 —0,556 0,444 0,6664 1,000 —0,633 0,367 0,6060 1,000 —0,586 0,414 0,6435 1,000 —0,548 0,452 0,6724 1,000 —0,190 0,810 0,9000 Важно помнить, что выражение 1—h2 соответствует характерности переменной, обозначаемой и2. О ней мы говорили при рассмотрении основных элементов дисперсии. Матрица специфичных факторов будет иметь следующий вид: Т аблица 5.2 Переменные CS1 CS2 CS3 CS4 CS5 C.S6 1 0,7721 0,0000 0,0000 0,0000 0,0000 0,0000 2 0,0000 0,6664 0,0000 0,0000 0,0000 0,0000 3 0,0000 0,0000 0,6060 0,0000 0,0000 0,0000 4 0,0000 0,0000 0,0000 0,6435 0,0000 0,0000 5 0,0000 0,0000 0,0000 0,0000 0,6724 0,0000 6 0,0000 0,0000 0,0000 0,0000 0,0000 0,9000 Она содержит шесть специфичных факторов, обозначенных CS1, С$2, ..., Cs6. Величины в столбцах—нагрузки этих факторов у шести перемен- ных. Ясно, что если возвести их в квадрат и прибавить к h2 соответ- ствующей переменной, то получим 1. Матрица специфичных факторов, объединенная с матрицей общих факторов, дает полную факторную мат- рицу, которая детально рассматривалась в первых разделах книги. О специфичных факторах мы говорим лишь в целях лучшего понимания значения и смысла общих факторов. В практике факторного анализа используются, как правило, векторы, которые меньше единицы. Это объясняется прежде всего тем, что, как уже неоднократно подчерки- валось, нас интересуют общие факторы, объясняющие корреляции и выражающие собой основное влияние, скрытое за величинами коэф- фициентов корреляции. На рис. 5.2 векторы отражают лишь общность, точнее говоря, их величины равны положительному корню квадрат- ному из общности. Совокупность факторных] нагрузок шести переменных (или набор их проекций на перпендикулярные оси координат), полученная в ре- 93
зультате Ьыделения трех последовательных факторов центроидным ме- тодом, не является, как мы знаем, единственно возможной. Почему это так? Вспомним, что здесь мы имеем дело с двумя основными элемен- тами, из которых один является постоянным, а второй — переменным. Постоянный неизменный элемент — это система или конфигурация век- торов, соответствующая переменным. Углы между векторами опреде- лены матрицей корреляции, с которой начинается процедура расчета факторов. Если обратиться к графической иллюстрации, то можно утверждать, что единственным постоянным элементом будет система стрел, направленных в разные стороны и выходящих из одной точки, как будто кто-то в кусочек пробки воткнул с разных сторон гвоздики различной длины. Изменяющимся элементом будет система координат, накладываемая на конфигурацию факторов. Этот элемент неопределен- ный в том смысле, что его можно вращать вокруг точки, представляю- щей собой начало координат, придавая ему теоретически бесконечное число возможных положений. Каждое из этих положений дает, оче- видно, другую совокупность проекций векторов на оси координат, т. е. другое множество факторных нагрузок. По окончании процесса выделения факторов мы получаем какую-то определенную совокупность нагрузок, соответствующую определенному положению систем координат. Это положение зависит от метода, ис- пользованного для расчета факторов. Таких методов, помимо центро- идного, подробно изложенного выше, существует несколько. Так как основная конфигурация векторов представляет собой неизменный эле- мент, то ее проекции на различно расположенные оси могут взаимно преобразовываться, являясь в этом смысле эквивалентными, с той лишь оговоркой, что при этом не изменяется начало координат, а только вращается система осей вокруг этой точки, представляющей собой в то же самое время начальную точку конфигурации векторов. Вращая таким образом систему координат, можно изменить набор факторных нагрузок. Эта операция в процедуре факторного анализа носит название вращения, или оборота, и соответственно первый набор «сырых» факторных нагрузок, полученных по окончании процесса вы- деления факторов каким-либо методом, называется исходным. Анало- гично можно говорить об исходной факторной матрице и о фактор- ной матрице после поворота, а также о повернутых факторах. Попытаемся проиллюстрировать сказанное с помощью упрощенного примера с одной переменной (рис. 5.3). Переменная Zr имеет одинако- вые факторные нагрузки Сх и С2, равные +0,5 (рис. 5.3, а). Если по- вернуть систему координат в направлении, обратном движению часо- вой стрелки, так что ось фактора С2 пройдет через точку т. е. совпа- дет с вектором переменной (рис. 5.3, б), то проекция Д на ось Сх, т. е. нагрузка фактора С1Т уменьшится до нуля, а проекция Zx на ось С2, т. е. нагрузка фактора С2, увеличится и в нашем упрощенном примере ста- нет равной длине вектора переменной Zr. Если изобразить этот случай на графике, новым осям координат ко- торого придано нормальное положение, параллельное линии пересе- чения плоскостей, то получим рис. 5.3, в. На этом рисунке точка Zr 94
лежит на оси CL Какова сейчас величина нагрузки С2? В нашем приме- ре она легко определяется с помощью прямоугольного треугольника OxZx на рис. 5.3, б. Нагрузка фактора С2 будет равна гипотенузе 0Zu которая равна в то же время длине вектора переменной Zx. Следовательно, (О ZJ2 = (Ох)2 + (xZJ*, (OZi)2 = (0,5)2 + (05)2, OZi = 1 (0,5)2 + (0,5)2 = 0,71. Формула, позволяющая вычислить новые проекции вектора после вращения осей системы координат, включает угол вращения. Если две нагрузки переменной обозначить С\ и С2, а угол вращения — а, то при вращении против часовой стрелки получим, что С[ =—Сх sin а + С2 cos а) , - CL cos а + С2 sin а ) а при вращении по часовой стрелке формула расчета новых факторных нагрузок будет иметь вид: С{ =C1sina + C2cosal > C^ — Cj^cosa—C2sinaJ Если с помощью транспортира измерить угол вращения на рис. 5.3, б, то окажется, что он составляет 45°. Вращение осущест- влялось против часовой стрелки. Косинус угла 45° равен синусу этого угла и составляет примерно 0,71. Таким образом, С; = — 0,5 X 0,71 + 0,5 X 0,71 = 0, С'2 = 0,5 X 0,71 + 0,5 X 0,71 = 0,71. Этот результат совпадает с тем, который был получен выше. Осу- ществляя вращение, мы изменяем проекции векторов (ф'акторные на- 95
грузки). Одни из них растут, другие уменьшаются. Необходимо, одна- ко, помнить что в процессе вращения неизменными остаются два эле- мента: суммы квадратов соответствующих пар проекций, или общно- сти и исходные корреляции между переменными. Первое вытекает про- сто из теоремы Пифагора, так как при вращении не изменяется длина вектора и гипотенуза треугольника, катеты которого представляют собой две проекции на две оси системы координат. Второе стано- вится понятным с учетом сказанного о неизменности основной кон- фигурации векторов. Возникает вопрос: для чего' осуществляется вращение системы координат и изменение факторных нагрузок? Почему нельзя остановиться на первом наборе нагрузок, полученных по окончании процесса выделения факторов? С математической точки зрения все возможные совокупности проекций, полученные в процессе вращения, эквивалентны, так как каждую из них можно преобразовать в другую, причем общности остаются постоянными для каждого поло- жения системы координат. Дело обстоит иначе при содержательной интерпретации факторных нагрузок (например, с психологической или социологической точки зрения). Как известно, разные методы расчета факторов дают разные положения системы координат и разные наборы факторных нагрузок. Эти наборы определяются исключительно свой- ствами техники данного метода и являются в этом смысле случайными. Эта проблема была предметом оживленных дискуссий в процессе раз- вития факторного анализа. Однако результаты многих работ и их срав- нение свидетельствуют о том, что в большинстве случаев существует ка- кое-то одно определенное положение системы координат, дающее набор факторных нагрузок, имеющий особое значение. Психолог, социолог или экономист, применяющие метод факторного анализа, не могут до- вольствоваться результатами, наилучшими лишь с чисто математиче- ской точки зрения. Они должны стремиться к получению таких резуль- татов, которые наилучшим образом соответствуют некоторой интерпре- тации факторных нагрузок, существенно связанной с проблематикой изучаемого явления. С этой точки зрения нельзя, как правило, оста- новиться на первом «сыром» наборе факторных нагрузок, а нужно ис- пользовать процесс вращения для нахождения такого положения систе- мы координат, которое дает наиболее эффективные результаты. Нужно искать факторы, соответствующие каким-то существенным элементам, о которых уже есть некоторая информация и о которых с наибольшей вероятностью можно утверждать, что они отражают определенные реальные существующие в природе зависимости. Исследователи, при- меняющие метод факторного анализа, считают, что существует одно положение осей координат, которое соответствует истинным факторам, а все другие возможные положения являются его математическими преобразованиями. То, что наряду с истинным положением системы координат существуют одновременно всевозможные ее случайные эквиваленты, есть просто неизбежный результат методов расчета факторных нагрузок. Этим и объясняется второй этап работы — вра- щение, в процессе которого нужно найти истинное положение системы координат, соответствующее реальным факторам. 96
2. ПРОСТАЯ СТРУКТУРА Определение такого истинного положения системы координат, даю- щее наиболее эффективные результаты, представляет собой одну из на- иболее трудных и тонких проблем факторного анализа. Правильное осуществление процесса вращения требует определен- ных знаний и опыта как в области самого факторного анализа и его тех- ники, так и в области той науки, где используется факторный анализ. Исчерпывающее изложение этой проблемы выходит за рамки данной работы, в которой можно подробно рассмотреть лишь один метод вра- щения. Этот метод широко применяется в практике и является, по- видимому, наиболее подходящим инструментом определения наилуч- шего положения системы координат. Концепция метода принадлежит Тэрстоуну, создателю центроидного метода, и носит характер стремле- ния к так называемой «простой структуре». Точно определить тер- мин «простая структура» с помощью нескольких слов нелегко. Сильно упрощая, можно в самом общем виде сказать, что стремление к простой структуре обусловлено двумя основными соображениями: 1) целесообразностью получения максимального числа больших фак- торных нагрузок; в случае анализа способностей целесообразно опре- делить максимальное количество положительных нагрузок; 2) целесообразностью получения наибольшего числа нулевых или относительно близких к ним нагрузок, которое возможно для данной системы переменных. Так как приведенные соображения на первый взгляд выглядят противоречивыми, обратимся снова к геометрической иллюстрации проблемы с помощью упрощенного примера двух перепендикулярных факторов (рис. 5.4.) В соответствии со сделанными выше предположениями точка на гра- фике соответствует концам векторов, представляющих переменные. Как видно, отдельные группы точек размещены на графике таким обра- зом, что одни из них лежат около оси С\ и вдалеке от начала координат, т. е. имеют большую по величине нагрузку фактора Сг и незначитель- Рис. 5.4 4 Зак. 377 97
пые (близкие к нулю) нагрузки факторов С2, тогда как другие лежат около оси С2 и далеко от начала координат, т. е. характеризуются боль- шими нагрузками фактора С2 и незначительными нагрузками фак- тора Сг. В основе концепции «простой структуры» Тэрстоуна лежит общее предположение, что в случае выбора между многими гипотезами, оди- наково хорошо объясняющими обнаруженные факторы, нужно принять наиболее простую из них, требующую минимального числа вспомо- гательных гипотез. «Простота» такой структуры факторных нагрузок заключается в этом случае в том, что каждая переменная имеет относи- тельно наиболее простое факторное объяснение, т. е. характеризуется доминирующим влиянием какого-то одного фактора, и наоборот, дан- ный фактор характеризует лишь некоторые из совокупности изучае- мых переменных. В многомерных системах эта проблема будет выглядеть гораздо слож- нее, однако принцип остается тем же. Если, например, в трехмерной системе определяется такое положение факторной оси, которое давало бы максимально возможное число точек с нулевыми или близкими к ним проекциями на нее, то, другими словами, отыскивается плоскость, которая перпендикулярна к этой оси и проходит через начало коорди- нат и в которой находится большинство интересующих нас точек (рис. 5.5). На рис. 5.5 хорошо видно, что перемещение оси Сг в положение С[, дает нулевые проекции на эту ось всех точек, лежащих в плоскости, перпендикулярной к Cj и проходящей через начало координат. Такая плоскость на языке факторного анализа называется гиперплоскостью данного фактора. Содержание простой структуры строго можно опре- делить как предельное распределение долей факторов у различных пе- ременных. Читатель может усомниться в обоснованности утвержде- ния Тэрстоуна о том, что простая структура действительно дает наи- лучшее положение системы координат. Наиболее веским доказатель- ством правильности принципа простой структуры являются, очевидно, экспериментальные данные, основанные на фактах. В настоящее время результаты многих сотен исследований в области психологии, социо- логии и физиологии, выполненных методом факторного анализа, сви- детельствуют в пользу принципа простой структуры. Умело выполнен- ная процедура вращения в подавляющем большинстве случаев приво- дит к системе простой структуры. Характерно то, что на основе каждо- го, даже совершенно случайного набора коэффициентов корреляции, записанного в виде матрицы, можно получить какие-нибудь факторы. Однако рисунки не дают изображения простой структуры, т. е. с их помощью нельзя увидеть гиперплоскость. Группировки точек, входя- щих в простую структуру, представляют собой своего рода «улики», выводящие на след каких-то действительных причин, влияющих на изучаемые корреляции. Необходимо, однако, помнить, что иногда да- же там, где из каких-то других источников известно о существовании выделенных факторов, простая структура может не обнаруживаться в явной форме в результате искажений, вызванных ошибками наблюде- 93
ний и вычислений. И наоборот, иногда получается так, что совершенно случайная система точек может дать явное изображение простой струк- туры, хотя в действительности ее, вообще говоря, не существует. Это не единственные трудности, на которые можно натолкнуться в поис- ках наилучшей системы координат. Процедура вращения весьма слож- на и требует большой осторожности и внимания. Необходимо отметить также, что кроме простой структуры суще- ствуют и другие критерии определения наилучшего положения систе- мы координат. Их можно применять одновременно с поиском простой структуры. Некоторые из них требуют непосредственного учета ха- рактера изучаемых переменных и результатов исследований в обла- сти, где используется факторный анализ. Укажем лишь несколько таких критериев: 1) при вращении можно руководствоваться стремлением к согласо- ванности результатов с достижениями исследований, выполненных другими методами; 2) можно руководствоваться стремлением к согласованности ре- зультатов с факторами, определенными в ранее выполненных работах по факторному анализу; 3) если в конфигурации векторов существуют большие пучки кор- реляций, то можно стремиться провести оси координат через их центр; 4) можно стремиться к определению совокупностей факторных на- грузок, согласующихся с какими-либо общими предположениями данной отрасли науки. Перейдем к иллюстрации процесса вращения с помощью примера с шестью переменными. 3. ПРОЦЕДУРА ВРАЩЕНИЯ В ТРЕХМЕРНОМ СЛУЧАЕ Когда удается определить наилучшее положение системы коорди- нат относительно конфигурации векторов, мы получаем, как принято говорить, какое-то факторное решение, или, пользуясь терминологией Тэрстоуна, «структуру». В принципе безразлично, перемещается ли си- стема векторов или система координат. С учетом того, что конфигурация векторов постоянно закреплена в исходной совокупности корреляций, а система координат является как бы следующим за ней элементом ана- лиза, в практике принято вращать прежде всего оси координат. Необхо- димо также напомнить, что вращение системы координат можно осу- ществлять лишь относительно определенной точки, которая является началом координат. Нельзя передвигать начало координат относи- тельно конфигурации векторов, так как это изменило бы значения ис- ходных корреляций. Приступая к вращению, мы ставим перед собой две главные задачи: а) определить наилучшее положение осей коорди- нат, которое дает наиболее явную простую структуру, и б) точно рас- считать новые проекции или факторные нагрузки векторов на новые оси координат. Решение этих задач можно осуществлять двумя методами: а) ис- пользуя геометрическую интерпретацию проблемы (рисунки, графики, 4* 99
модели) и б) выполняя соответствующие вычисления, приводящие к определению нового положения системы и новых проекций. Используя лишь графики, нельзя достичь высокой точности результатов, не говоря уже о том, что в многомерных случаях их применение требует кропот- ливой работы. Однако применительно к задаче определения наилучшего положения осей графическая интерпретация играет главную роль. Только с ее помощью можно наглядно представить, как перемещаются отдельные группы точек относительно вращаемых осей, что облегчает поиск простой структуры. Вторую основную задачу вращения—точное определение новых проекций на передвинутые оси системы коорди- нат — можно, особенно в многомерных системах, осуществить быстрее и легче при помощи алгебраических и тригонометрических вычислений. Начнем с графика для совокупности шести переменных и их системы координат в таком положении, в котором она находилась по окончании процесса выделения факторов. Поступим так, как это описано на стр. 92, используя разложение трехмерной системы на три двумерных элемента. Рисуя эти графики, мы исходим из первой факторной мат- рицы, обозначаемой Уо (табл. 5.3). Таблица 5.3 Исходная факторная матрица шести переменных Vo Переменные сг с. 1 0,500 0,365 0,145 2 0,733 —0,118 0,075 3 0,726 —0,095 0,312 4 0,717 —0,220 —0,155 5 0,590 —0,404 —0,194 6 0,219 0,365 —0,099 Графики лучше всего чертить на миллиметровой бумаге, отмечая на соответствующих осях значения проекций, содержащихся в мат- рице Vo. В нашем примере графики изображены на рис. 5.6. На этих исходных графиках еще не видно следов ярко выраженной структуры. Местонахождение шести точек носит совершенно случай- ный характер. Однако более глубокое изучение рисунков показывает, что поворот осей координат Сг и С2 (рнс. 5.6, а) на 45°против часовой стрелки до положения и С2 дает отчетливые нагрузки фактора Сх при переменных 2, 3, 4 и 5 и близкие к нулю нагрузки этого фактора при переменных 1 и 6. После осуществления первого этапа вращения возникает проблема определения новых проекций шести переменных на оси С\ и С2. В слу- чае вращения трехмерных и «-мерных систем используется более слож- ный метод по сравнению с описанным на стр. 92. Не вдаваясь глубоко в математические основы этого метода, приведем лишь несколько общих соображений, которые могут облегчить понимание его главных этапов. Так как оси координат перемещаются на некоторый угол относительно 100
их исходного положения, нужно прежде всего установить, каким обра- зом можно вообще количественно определить направление любой оси в пространстве. Если рассматривать вращаемую ось как вектор, то из аналитической геометрии известно, что его положение в трехмерном пространстве может быть определено тремя углами, заключенными меж- ду этим вектором и тремя взаимно перпендикулярными осями какой- либо системы координат. Как известно, углы могут быть представлены их косинусами. Эти косинусы, определяющие положение вектора отно- сительно системы координат, называются в аналитической геометрии направляющими косинусами. Для однозначного определения положения вектора на плоскости в двумерном случае достаточно двух направля- ющих косинусов, в трехмерном нужны три, а в «-мерном пространстве и. На их основе можно построить уже известную нам систему, которая называется матрицей направляющих косинусов. При вращении нас интересует перемещение осей координат, от- носительно их исходного положения. Поэтому новое положение пере- местившейся оси можно определить при помощи направляющих коси- нусов, рассчитанных с учетом исходного положения осей координат, которое трактуется как система отсчета. Если исходные перпендику- лярные оси (факторы) обозначить через Сх, С2 и С3, а их новые положе- ния после вращения — через С[, С2 и Сз, то эти новые положения от- носительно исходных можно определить при помощи матрицы направ- ляющих косинусов, которые в общем виде можно представить с по- мощью табл. 5.4, где направляющие косинусы обозначены через X. Элементы такой матрицы представляют собой направляющие коси- нусы углов, заключенных между новым положением осей и системой отсчета, образующей исходные оси. Дополнительное пояснение дает рис. 5.7, на котором в целях упрощения перемещается лишь одна из Рис. 5.6. Исходная система шести векторов на основе первоначальной фактор- ной матрицы Vo 101
Т а б л и ц а 5.4 Матрица направляющих косинусов Переменные <?2 Сз Сг хг с С1С2 С2 Хс2С{ ХС2С2 хс2с- Cs хс3с; Хс3с^ хс3с- трех осей. Косинус тупого угла а между Cs и Сз соответствует эле- менту ХСаС' матрицы. Соответственно косинус угла Р соответствует элементу XClC^ а косинус угла у — элементу -ХС1С'- Теперь видно, что три направляющих косинуса, являющиеся элементами столбца Сз матрицы, полностью определяют новое положение оси Сз относи- тельно исходной системы координат. Важно еще отметить и то, что сумма квадратов косинусов каждого столбца матрицы равна 1 при предположении, что длина вращаемой оси равна 1. Для двумерных систем это очевидно из теоремы Пифагора, однако отмеченное свойство присуще также трехмерному и «-мерному пространству. Как правило, предполагается, что каждая ось системы координат представляет полную дисперсию данного фактора, равную 1, а потому имеет длину, также равную 1. В общем виде новые направления осей системы координат могут быть определены матрицей направляющих косинусов, содержащей столько столбцов, сколько осей в системе. Каждый из этих столбцов включает значения косинусов, определяющих углы новых осей относи- тельно перпендикулярных осей исходной системы координат. Новые оси размещаются, как правило, в пространстве такой размерности, ка- кая была характерна для старых осей, поэтому матрица направляющих косинусов будет квадратной и содержит число строк, соответствующее размерности пространства. Столбцы и строки такой матрицы будут нормализованными, т. е. сумма квадратов содержащихся в них на- правляющих косинусов будет равна 1. Та- кая матрица (табл. 5.4), содержащая на- правляющие косинусы новых осей относи- тельно исходных, называется матрицей трансформации, или Х-матрицей. Действи- тельно, она преобразовывает исходные оси в новые повернутые и одновременно являет- ся основой расчета проекций векторов, представляющих переменные, на новые, по- вернутые оси. Процедура расчета новых проекций в общем относительно проста и заключается в умножении матрицы исходных фактор- 102
ных нагрузок (Vo) на матрицу трансформации X. Необходимо при этом помнить, что нельзя умножать матрицу А на матрицу Ес, так как в матричной алгебре произведение а X b не равно произведению b х а. В результате умножения получим первую матрицу повернутых факто- ров Vi- Рассмотрим последовательно все необходимые операции. Непосредственно за графиками и определением угла первого вра- щения следует расчет матрицы X. Как это делается? Начиная вращение, нужно прежде всего составить матрицу трансформации для исходного положения системы координат. Строго говоря, первая матрица X не является еще трансформирующей, так как воссоздает исходное положе- ние факторов. Это особая форма матрицы X. Она строится с учетом сле- дующих соображений: направляющий косинус для Сх относительно Сг равен 1, так как ось Сг сама с собой образует угол 0°. Направляющий косинус для Сг относительно С2 составит 0, так как угол между ними ра- вен 90°. Аналогично направляющий косинус относительно С3 будет равен 0. Точно так же построим остальные столбцы. В результате по- лучим матрицу X, изображенную на рис. 5.5. Это матрица Л системы перпендикулярных осей относительно нее самой. Если умножить ма- трицу Vc на такую матрицу X, получим ту же матрицу Vo, так как вра- щение ее было осуществлено. Ознакомившись со способом умножения матриц, который излагается ниже, читатель может легко проверить данное утверждение. Т а б л и ц а 5.5 Первая матрица трансформации X Переменные с. с, с, Ci 1,0 0 0 с2 0 1,0 0 С3 0 0 1,0 Теперь приступим к вычислению матрицы X для первого вращения, которое, как мы помним, заключалось в повороте осей координат Сг и С2 (рис. 5.6, а) на 45° против часовой стрелки. Расчет новых направ- ляющих косинусов осуществляется по формуле (С{) = (CJ — (tg 450)1 • (С2), (5.3) где (CJ) — столбец направляющих косинусов для С{. Аналогично по- ступают в отношении других осей. Тангенс, на который умножается величина С2, имеет отрицательный знак, так как мы движемся в на- правлении от оси С2. Далее выполняем следующие операции: 1. Переписываем по горизонтали столбец косинусов для в матри- це X рядом с аналогичным столбцом для С2. 1 Тангенсом угла а называется отношение противолежащего катета ко вто- рому катету в прямоугольном треугольнике. Тангенс любого угла можно найти в простых таблицах значений тригонометрических функций. 103
2. Столбец Cz умножаем на —tg45°, что составляет —1, и резуль- тат прибавляем к Сг. (С2) = 0 1,0 0 С!=1,0 о о (—tg45°)(C2) = 0 -1,0 0->(—tg45o)(C2) —0 -1,0 0 C1-(tg45°)(C2) = l,0 -1,0 О 3. Нормализуем полученные направляющие косинусы с учетом того, что длины осей равны 1 и поэтому квадраты направляющих косину- сов должны в сумме давать единицу. Нормализация совокупности чи- сел заключается в возведении каждого числа в квадрат, расчете суммы этих квадратов и делении каждого числа на корень квадратный из этой суммы. В случае трех чисел а, Ь, и с нормализованные величины составят: а ь с "|/а2+62-}-с2 "[/а2 + й2 + с2 У a2 -pfe2|-c2 Нормализованные направляющие косинусы для Сг составят: 0,71 —0,71 0. 4. Аналогично вычисляем направляющие косинусы для оси С2 с тем, однако, что теперь прибавляем (tg 45°) • (Сх) к С2, так как ось С2 движется к оси Сг. Теперь формула будет иметь вид: (С2) = (С2) + (tg 45°) (Q). Сделав подстановку, получим: С2 = 0 1,0 0 (tg 45°)(С1) = 1,0 0 0 C2 + (tg45°)(C1)= 1,0 1,0 0 5. Нормализуя вычисленные косинусы, получим: 0,71 0,71 0 6. Составляем из рассчитанных столбцов новую матрицу трансфор- мации Aj. Ее столбец С'3 остается пока тем же, что и в матрице X, так как положение оси С3 не менялось. 7. Умножая матрицу исходных факторов Vo на матрицу 7^, получим первую матрицу повернутых факторов Vx. Таблица 5-6 Vo Tii Vi с. С, C8 1 0,500 0,365 0,145 2 0,733 —0,118 0,075 3 0,726 —0,095 0,312 4 0,717 —0,220 —0,155 5 0,590 —0,404 —0,194 6 0,219 —0,365 —0,099 Cl ?2 Сз Ct 0,71 0,71 0 a —0,71 0,71 0 c3 0 0 1 C\ C2 С’з 1 0,096 0,614 0,145 2 0,604 0,436 0,075 3 0,582 0,448 0,312 4 0,665 0,353 —0,155 5 0,705 0,132 —0,194 6 -0,104 0,414 —0,099 104
Умножение осуществляется следующим образом: каждый элемент данной строки матрицы Vo умножается на соответствующий элемент столбца данного фактора матрицы Aj. Сумма этих произведений дает соответствующий элемент столбца этого фактора в новой матрице Например: первый столбец матрицы Кх получается последователь- ным умножением строк Кс на первый столбец матрицы Ах: 1. (0,500 • 0,710) + (0,365 • —0,710) + (0,145 • 0) = 0,096. 2. (0,733 • 0,710) + (—0,118 • —0,710) + (0,075 • 0) = 0 604. 3. (0,726 0,710) + (—0,095 • — 0,710) + (0,312 • 0) = 0,582 и т. д. Второй столбец матрицы Vr получается последовательным умно- жением строк Vo на второй столбец Af 1. (0,500 • 0,710) 4- (0,365 • 0,710) + (0,145 • 0) = 0,614. 2. (0,733 • 0,710) + (—0,118 • 0,710) + (0,075 • 0) = 0,436. 3. (0,726 • 0,710) + (—0,095 • 0,710) + (0,312 0) = 0,448 и т. д. Третий столбец матрицы получается последовательным умно- жением строк Vo на третий столбец Ах: 1 (0,500 • 0) + (0,365 0) + (0,145 • 1,0) = 0,145. 2 (0,733 • 0) + (—0,118 • 0) + (0,075 • 1,0) = 0,075. 3. (0,726 . 0) + (—0,095 • 0) + (0,312 1,0) = 0,312 и т. д. В итоге получаем первую матрицу повернутых факторов Кх, т. е. проекций векторов на оси Сх и С2, повернутых на 45° против часовой стрелки. Как видим, нагрузки в столбце С3 матрицы Vx остались те- ми же, что и в матрице Ко, так как ось С3 не изменила своего положе- ния. Теперь нужно снова начертить три рисунка, изображающие поло- жение векторов после первого вращения. Эти рисунки (5.8) чертятся так же, как и раньше, но теперь уже с учетом новой матрицы нагрузок Vx- Изучение рисунков показывает, что целесообразнее всего вращать оси G и Сз на 45° против часовой стрелки (рис. 5.8, б). После этого а В 5 ® 5 '0,7* -0,6 -0.5 -0.6 -0.3 0.2 0.1 г" ^2 -0,7 0,69! -0.5 ®2 -0.6 -0.3 -0.2 0.1 0,2 0.3 0.6 0.5 0.6 -0.1 -0.2 -0.3 1м7\0.1 0.2 0,3 0.6 z -0.2 \ -0.3 -Сг Z9' А , , I 0.3 02 0.1 6® 0.7 of -0.5 -0.6 -0,3 -0.2 0.1® 01 02 0,3 0.6 0,5 -0.1 -0.2 0.3 6 ® 2 7 ® ! 3 ®6 6 ц ® ® А *3 Рис. 5.8. Система шести векторов после первого вращения 105
можно приступить к расчету и построению матрицы Х2 для следующе- го вращения. Это делается так же, как и ранее, но с учетом того, что исходным пунктом вычислений будет на этот раз матрица Ар Новые направляющие косинусы определяются по формулам: (Сз)=(Сз)+№45°)(С2); (C2 = (G)-(tg45°)(C3). В первой формуле тангенс имеет положительный знак, так как ось С'з сдвигается к С2. Во второй формуле тангенс берется с от- рицательным знаком, так как ось С2 сдвигается в направлении от С3. Далее выполняются следующие операции: 1. Направляющие косинусы С3 берутся из матрицы Xj. Сз= 0 0 1,0. Так как тангенс 45° = 1,0, значение (tg 45°) (С2 ) составит: 0,71 0,71 0 (см. матрицу АД В соответствии с вышеприведенной формулой определяем сумму Сз = 0 0 1,0 (tg 45°)(С2)=0,71 0,71 0 (Сз)=0,71 0,71 1,0 * 2. Нормализуя рассчитанные направляющие косинусы, получаем 0,50 0,50 0,71 3. Вычисляем направляющие косинусы для второй вращаемой оси (О 62 = 0,71 0,71 0 (—tg 45°)(Сз)=0 0 —1,0 0=0,71 0,71 —1,0’ 4. Нормализуем полученные направляющие косинусы для С2 0,50 0,50 —0,71 5. Строим матрицу Х2. Столбец С{ будет в ней тот же, что и в ма- трице Xj, так как ось С[ не вращалась. 6. Умножаем снова матрицу исходных факторов Vo на матрицу Х2. В результате получаем вторую матрицу повернутых факторов V2. Т а б л и ц а 5.7 Vo Х2 V2 С, с, С, 1 0,500 0,365 0,145 2 0,733 -0,118 0,075 3 0,726 —0,095 0,312 4 0,717 —0,220 —0,155 5 0,530 —0,404 —0,194 6 0,219 0,365 —0,099 tf Cl с2 с3 Ci 0,71 0,50 0,50 С2 —0,71 0,50 0,50 Сз 0 —0,71 0,71 С1 с2 с'з 1 0,096 0,329 0,535 2 0,604 0,254 0,360 3 0,582 0,095 0,537 4 0,665 0,358 0,138 5 0,705 0,230 —0,044 6 —0,104 0,361 0,221 106
Умножение осуществляется по вышеприведенной схеме. Первый столбец матрицы V2: 1 (0 500 • 0,710) + (0,365 • —0,710) + (0,145 • 0) = 0,096. о (0 733 • 0,710) + (—0,118 • —0,710) + (0,075 • 0)-= 0,604. з' (0*726 • 0,710) + (—0,095 • —0,710) + (0,312 • 0) = 0,582 и т. д. Второй столбец матрицы V2: 1 (0,500 • 0,50) + (0,365 • 0,50) + (0,145 • —0,710) = 0,329. i (0,733 • 0,50) + (—0,118 • 0,50) + (0,075 • —0,710) = 0,254. 3. (0,726 • 0,50) + (—0,095 • 0,50) -ф (0,312 • —0,710) = 0,095 и т. д. Третий столбец матрицы V2: 1 (0,500 • 0,50) + (0,365 • 0,50) + (0,145 • 0,710) = 0,535. 2 (0,733 • 0,50) + (—0,118 • 0,50) -ф (0,075 • 0,710) = 0,360. 3. (0,726 • 0,50) + (—0,095 - 0,50) -ф (0,312 • 0,710) = 0,537 и т. д. Итак, получен новый набор проекций шести векторов на новую си- стему координат, возникшую в результате двукратного вращения осей Сх и С2 и осей С2 и Сз на 45° против часовой стрелки. Теперь нужно прежде всего проверить, получили ли мы систему факторных нагру- зок, которая была выше охарактеризована как «простая структура», и если получили, то какова степень ее соответствия системе координат. Для этого еще раз обратимся к чертежам, изображающим размеще- ние точек после двух вращений (рис. 5.9). При этом мы будем исхо- дить из матрицы V2. Даже беглого взгляда достаточно, чтобы увидеть большие измене- ния. При таком небольшом количестве переменных нельзя, видимо, ожидать появления какой-либо четкой картины простой структуры. Однако более тщательное изучение рисунков показывает, что нам уда- лось выйти на правильный путь к простой структуре. Во-первых, почти все факторные нагрузки имеют положительные значения. Лишь В 5 0.7 - ® , ? * о.б -i ® 0.7 0,6 0.5 0.0 0.3 0.2 0.1 J—i___ 0.5 0,0 0.3 02 0.1 0.2 0.1 0.1 02 0,3 0.0 0.50,6 0.1 0.1 0.2 0.3 0,0 0,5 0.1 о.о 0.3 0.2 0.1 j___1___L_ 0.3 0,2 0.1 1 г" I I I ।_________I---— 01 0.2 0,3 0,0 0.5 0.6 -0.1 ®6 0.2 с, Z?2 0.1 о 0 6 2 ® Рис. 5.9. Система факторных нагрузок шести переменных после двух вращений 107
переменная 6 имееет отрицательную нагрузку фактора С'[, которая вообще-то не намного отличается от нуля. Наиболее существенно, од- нако, то, что на каждом из трех рисунков можно найти переменные с факторными нагрузками, близкими к нулю, т. е. переменные, лежа- щие в соответствующих гиперплоскостях. Например, у переменных 1 и 6 практически равны нулю нагрузки фактора С{; у переменной 3 равна нулю, а у переменной 5 весьма незначительна нагрузка фактора Сг. Переменная 5 имеет нулевую, а переменная 4 — незначительную нагрузку фактора С'г. Понятно, что точки редко будут находиться точ- но на нулевой линии проекции, поскольку различные ошибки и откло- нения как в исходных корреляциях, так и при округлении результа- тов расчетов приводят к значительным искажениям. На практике на- грузки, лежащие в границах от +0,1 ДО—0,1, принимаются равными нулю. Если в нашем случае передвинуть эти границы до ±0,13,то каж- дому фактору будет соответствовать одна или две переменные, лежа- щие в гиперплоскости, что доказывает тенденцию к простой структуре. Несомненно, что возможна дальнейшая корректировка вращений, могущих привести к получению лучшего отражения простой структу- ры. Так как наша главная цель заключалась прежде всего в изложе- нии самого метода и техники расчетов в процессе вращения, мы не будем рассматривать эту проблему, так как все дальнейшие действия осуществляются уже описанным путем. Необходимо также подчеркнуть, что в нашем примере по тем же соображениям был выбран острый угол вращения 45°, что позволило избежать сложных «показательных» вычислений. Более обоснованный выбор угла вращения мог бы опре- деленно улучшить простую структуру. Предоставляя читателю возмож- ность самому убедиться в этом, проделав необходимые операции, за- кончим описание процедуры вращения. 4. ОСНОВНЫЕ СПОСОБЫ ПРОВЕРКИ ПРАВИЛЬНОСТИ РАСЧЕТОВ В ПРОЦЕССЕ ВРАЩЕНИЯ Процесс вращения связан с тем счастливым обстоятельством, что возможные ошибки, например при измерении угла вращения на гра- фике или в результате неточного вычерчивания самого рисунка, не на- капливаются в ходе выполнения всей операции. При каждом передви- жении оси мы возвращаемся к неизменной основе, которой является исходная факторная матрица Уо. Новая факторная матрица после по- ворота получается каждый раз путем умножения этой основной матри- цы на новую матрицу трансформации X. Наиболее неприятны те ошибки, которые могут возникнуть на по- следней операции, приводящей к окончательной факторной матрице Vn, где п — число вращений. В принципе существуют два основных способа проверки правильности вычислений, которые могут использо- ваться в случае ортогональных систем. Первый из них заключается в расчете суммы квадратов нагрузок каждой переменной, которая всегда должна быть равна элементам h2 в матрице Vo. Это объясняется тем, 108
что при вращении не изменяется ни длина векторов в пространстве об- щих факторов, ни начало координат. Для примера с шестью перемен- ными все расчеты сведены в табл. 5.8. Т а б л и ц а 5.8 Факторная матрица шести переменных после двух вращений V2 Переменные Факторы /г2 Отклоне- ния С1 // С2 Сз по Уя по Vo 1 0,096 0,329 0,535 0,403 0,404 0,001 2 0,604 0,254 0,360 0,557 0,556 0,001 3 0,582 0,095 0,537 0,635 0,633 0,002 4 0,665 0,358 0,138 0,589 0,586 0,003 5 0,705 0,230 —0,044 0,552 0,548 0,004 6 —0,104 0,361 0,221 0,188 0,189 0,001 Если сопоставить табл. 5.8 с табл. 5.1, то окажется, что отклонения между величинами /г2, рассчитанными на основе матрицы Vo (табл. 5.1) и на основе матрицы V2 (табл. 5.8), весьма незначительны. Поэтому можно считать, что расчеты были в достаточной степени точными. Второй способ проверки обусловлен тем фактором, что вращение не изменяет углов между векторами переменных. Поэтому не изменяются исходные корреляции между каждой парой переменных. Как известно, эти корреляции могут быть воспроизведены из факторных нагрузок путем суммирования произведений соответствующих нагрузок. Вспом- ним уже знакомую нам формулу, которая приводилась последний раз при изложении основ расчета факторных нагрузок. В случае с тремя общими факторами Сг, С2 и С3 корреляции между переменными опре- деляются по формуле >'аъ = (гас1)Х(гьс1)+(Гасг)Х(гьсг) + (гас3) X (гьс>). Поскольку воспроизведение этим путем всей матрицы исходных кор- реляций может быть весьма трудоемким, достаточно вычислить лишь корреляции, находящиеся над главной диагональю (r12 , г2 3 и т. д.), и корреляции, находящиеся в правом верхнем углу матрицы (г12), так как при этом нагрузки каждой переменной будут использованы дважды. Применяя этот критерий, выполняем следующие операции: 1. Вычисляем произведения нагрузок данной пары переменных по приведенной формуле. Для переменных 1 и 2 получим: /•1,2 = (0,096) • (0,604) + (0,329 . 0,254) + (0,535 • 0,360) = 0,3340. 2. Определяем, сколько раз каждая переменная меняла знак. Это легко сделать, подсчитав, сколько раз менялся знак цемтроидных на- грузок данной переменной в факторной матрице V’o. Например, табл. 5.7 показывает, что переменная 1 ни разу не меняла знак, переменная 2 изменила знак плюс на минус при факторе С2 и затем минус на плюс при факторе С9. Таким образом, эта переменная меняла знак дважды 109
в процессе расчета трех факторов. Если общее число случаев изменения знаков обоих переменных четное, то к сумме произведений нагрузок этих переменных добавляется соответствующий остаток после выделе- ния последнего фактора (табл. 4.7) с таким знаком, который был у этого остатка в матрице остаточных корреляций. Если число изменений знаков нечетное, то знак остатка изменяется перед его сложением с суммой произведений. 3. Округленный результат должен быть равен исходной корреля- ции двух переменных. Результаты проверки приводятся в табл. 5.9. Т абл ица 5.9 Воспроизведение исходных корреляций иа основе факторных нагрузок матрицы V2- Перемен- ные Сумма произве- дений Остаточная корреляция после послед- него фактора Число изменений знаков обеих переменных Сумма про- изведений и остатков Исходные кор- реляции из табл. 4.1 Откло- нения 1,2 0,3340 —0,0349 четное (2)— 0,2991 0,299 0,0001 2,3 0,5689 0,0016 четное (4) + 0,5705 0,568 0,0025 3,4 0,4951 0,0055 нечетное (3)— 0,4896 0,487 0,0026 4,5 0,5451 0,0028 четное (2)Т 0,5479 0,545 0 0029 5,6 0,0000 —0,0173 четное (2)— 0,0173 —0,016 0,0013 1,6 0,2270 —0,0044 нечетное (1)^=- 0,2314 0,232 0,0006 Незначительные отклонения между исходными и рассчитанными корреляциями (наибольшее составляет 0,0029) можно приписать мелким ошибкам при округлении. В заключение необходимо еще раз подчер- кнуть, что применение всевозможных критериев правильности расче- тов имеет большое значение на всех этапах процедуры факторного ана- лиза. В особенности это касается операций выделения факторов, где существенная ошибка, например в первой матрице остатков корреля- ций, обнаруженная слишком поздно, перечеркивает полностью огром- ную раОоту, затраченную при вычислении следующих факторов. На этом заканчивается рассмотрение основных проблем вращения, которое завершает полный цикл основных вычислительных операций центро- идного метода. Этот цикл включает следующие операции: 1) построение корреляционной матрицы и оценку начальных зна- чений общностей; 2) выделение первого центроидного фактора; 3) вычисление остатков после определения первого фактора; 4) изменение знаков элементов матрицы остатков корреляции и определение общностей в этой матрице. Цикл (пп. 2—4) повторяется для следующих центроидных факторов до тех пор, пока не будет ис- черпана вся общность, содержащаяся в первой корреляционной ма- трице; 5) построение исходной факторной матрицы; 6) вращение осей системы координат для получения простой струк- туры. Результатом всей процедуры явится факторная матрица после по- ворота.
Глава шестая ИНТЕРПРЕТАЦИЯ ФАКТОРОВ В результате описанных выше расчетов была получена система нагрузок трех ортогональных факторов, характеризующая шесть ис- ходных переменных. С самого начала необходимо обратить внимание на то, что этот результат процедуры факторного анализа, несомненно, содержит неточности, обусловливающиеся рядом обстоятельств. Даже если предположить, что исходные коэффициенты корреляции были по- лучены при соблюдении всех необходимых условий, то и тогда они от- ражают действительные взаимосвязи только с некоторым приближе- нием. Другие причины возможных отклонений заключаются в самом процессе факторного анализа. Вспомним, что, приступая к расчету факторов, мы уже вынуждены были произвольно определять или оце- нивать значения общности А2, находящиеся на диагонали корреляци- онной матрицы. Мы видели также, что в процессе расчетов эти оценки № отличаются от окончательных значений, исчисленных как суммы квадратов факторных нагрузок. Даже незначительная ошибка при опре- делении исходных величин № влияет на всю корреляционную матрицу и на величины последовательно рассчитываемых факторных нагрузок. На результаты могут влиять также случайные ошибки в расчетах, которых мы старались избежать, пользуясь различными приемами проверки правильности расчетов. Все это нужно помнить, применяя методы факторного анализа. Если предположить, что в результате вращения получена достаточ- но надежная факторная матрица, то естественно обратиться к следую- щему этапу, связанному с правильным использованием результатов. Первая задача этого этапа — распознать природу полученных факто- ров. Это трудная и тонкая задача, требующая прежде всего некоторого изменения позиции исследователя, применяющего метод факторного ш
анализа. Теперь он должен превратиться из статистика, заботящегося в первую очередь о правильности и точности вычислений, в эксперта по проблеме, закономерности которой исследовались с помощью фак- торного анализа. До сих пор речь шла о «переменных» безотносительно к их конкретному содержанию, так как со статистической вычислитель- ной точки зрения характер изучаемых переменных не имеет существен- ного значения. За исключением процесса вращения, а точнее, до мо- мента, когда определяется наилучший угол поворота осей системы ко- ординат, вся описанная вычислительная процедура выделения факто- ров является неизменной: идет ли речь о психологических, социологи- ческих, физиологических или каких-либо других переменных. Ситуа- ция существенно изменяется при переходе к интерпретации полученных факторных нагрузок с целью определения природы выделенных фак- торов. Теперь уже необходимо взять на вооружение все наши знания о переменных, подвергшихся факторному анализу. Вооружившись этими знаниями, можно приступить к тщательному анализу последней факторной матрицы для определения того, какие переменные сущест- венно нагружены данным фактором, а какие вообще с ним не связаны. Первые гипотезы о природе выявленных факторов могут основываться на наблюдениях и наших знаниях о самих переменных. Обратимся к примеру с шестью переменными для иллюстрации типичного про- цесса интерпретации результатов факторного анализа. В соответствии с тем, что было сказано выше, нужно прежде всего как можно более точно охарактеризовать переменные, подвергшиеся анализу. В качестве примера здесь использовались результаты серии из шести так называемых «бумажных» тестов, реализованных в груп- пе из 133 учеников средней профессиональной школы. 1. Тест построения чисел К,ува. На карточке с одной стороны на- печатано 100 двузначных чисел в виде прямоугольной шахматной таблицы. На обороте точно так же напечатано 40 двузначных чисел. Все эти числа разбросаны среди 100 чисел на лицевой стороне. Задача испытуемого заключается в последовательном поиске и вычеркивании 40 чисел, находящихся на оборотной и повторяющихся среди 100 чисел на лицевой стороне карточки. Время теста ограничено 10 минутами. Результат измеряется количеством найденных и правильно вычеркну- тых чисел. 2. Тест графических заданий. Обследуемому дают формуляр с раз- личными рисунками. Задача заключается в выполнении простых зада- ний типа: «Соединить круг А с кругом В прямой линией» и т. п. Зада- ния прочитываются только раз. Ученики приступают к выполнению каждого из них сразу же после этого. Время выполнения отдельных заданий ограничено. Задания ранжированы по возрастающей трудности. Показателем результата являются очки за правильно выполненные задания. 3. Тест умозаключений. Он включает 10 заданий, сводящихся к про- стым рассуждениям и частично требующих пространственного вообра- жения. Рассуждения касаются соотношений величин и простых обоб- щений. Каждое задание объясняется письменно. Ученик должен про- 112
читать и понять инструкцию, прежде чем приступить к выполнению задания. Показателем результата является число правильных ответов. 4. Тест противоречий. Задача заключается в нахождении антони- мов к предложенным словам, например «длинный — короткий» и т. д. Кроме элементов рассуждения в этом тесте имеет значение запас слов и чувство языка. Тест включает 50 элементов. Показатель результа- тов— число правильных ответов. 5. Тест пробелов в словах. Типичным является тест Эббингхауза, р котором требуется вставить пропущенные слоги. Этот тест подбира- ется по содержанию и степени трудности с учетом уровня профессио- нальной школы. Показателем результата является число правильно заполненных пробелов. 6. Письменный тест механических способностей. Ученикам пред- лагают схемы простых механизмов, в которых отсутствуют некоторые важные детали. В тексте дается подробное объяснение работы механиз- мов. Ученик должен дорисовать отсутствующие части. Оценка осущест- вляется на основе установленных критериев по 10-балльной системе. Как видим, все, за исключением тестов 1 и 6, относится к типичным тестам умственных способностей, называемых также тестами умствен- ного развития. Тест 1 рассматривается обычно как проверка концент- рации внимания и быстроты реакции на цифры. Рассмотрим теперь последнюю факторную матрицу, в которой но- мера тестов дополнены их названиями (табл. 6.1). Обратимся прежде всего к столбцу нагрузок первого фактора во всех тестах. Таблица 6.1 Окончательная факторная матрица шести тестов Тесты Факторы 1 П III 1. По Куву 0,096 0,329 0,535 2. Графических заданий 0,604 0,254 0,360 3. Умозаключений 0,582 0,095 0,537 4. Антонимов 0,65 0,358 0,138 5. Пробелов в словах 0,705 0,230 —0,044 6. Механический —0,104 0,361 0,221 Таблица показывает, что тесты 4 и 5 характеризуются наибольшими нагрузками первого фактора. Сравним это явление с характером обоих тестов. Несомненно, что в них очень большую роль играет чувство язы- ка, запас слов и другие подобные элементы, из которых состоит фактор, получивший в психологии название «вербального», или «словесного», фактора и обозначаемый символом V. Посмотрим, как выглядят нагрузки этого фактора по другим переменным. Незначитель- ные нагрузки в тестах 1 и 6 подтверждают нашу гипотезу, так как ни в первом, ни во втором случае практически не используется словесный материал. Труднее интерпретировать тесты 2 и 3, характеризующиеся значительными нагрузками первого фактора. Если, однако, при этом Учесть, что тест 2 (графический) требует точного и быстрого понима- 113
ния устных заданий при ограничении времени, а в тесте 3 (умозаключе- ния) учитывается правильное понимание письменных инструкций, причем некоторые задания основываются на словесном материале, то можно сделать вывод, что эти две нагрузки не противоречат принятой гипотезе. Обратимся теперь к столбцу второго фактора. Здесь ситуация менее ясная. Разница между нагрузками не так высока. Наиболее вы- сокую нагрузку имеет тест 6. Это наводит на мысль, что речь идет или о так называемом «механическом» факторе, который может проявлять- ся в различных формах (например, «понимание основ работы механиз- мов» или «умение обращаться с механизмами»), или о связанном с ним факторе «пространственной ориентации». При таком предполо- жении становится понятной низкая нагрузка этого фактора в тесте 5 (пропущенные слоги в словах). В то же время низкая нагрузка в тесте 3 (умозаключения) несколько затемняет картину, так как тест вклю- чает задания, в которых требуется чувство пространства. Труднее все- го интерпретировать относительно высокую нагрузку второго фактора в тесте антонимов (4). Возможно, что необходимо как-то изменить вращение оси этого фактора. Если принять гипотезу о том, что речь идет о «пространственном» факторе, то становятся понятными нагруз- ки в тестах 1 (нужно определить положение чисел в шахматной таблице), 2 и 6 и сохраняется неясность в отношении тестов 3, 4 и 5. Нагрузки третьего фактора интерпретируются легче. Наиболь- шие нагрузки этого фактора имеют тесты 1 и 3. В первом из них нужно оперировать цифровым материалом, во втором некоторые зада- ния связаны с расчетами. Наиболее низкие нагрузки этого фактора характерны для обоих языковых тестов 4 и 5. Поэтому можно предполо- жить, что речь идет о «числовом», или «цифровом», факторе который можно также определить как умение обращаться с цифровым материа- лом (символ N). Средние нагрузки этого фактора в тестах 2 и 6 не про- тиворечат такой интерпретации. Таким образом, путем сравнения са- мых высоких и самых низких факторных нагрузок в столбцах фактор- ной матрицы при одновременном учете характера теста можно прий- ти к определенным гипотезам о природе рассчитанных факторов, хотя не всегда такой подход дает хорошие результаты. В нашем примере не вызывает сомнений характер первого фактора, в то время как интерпре- тация двух остальных более спорная. Можно видеть также, что описан- ная в качестве примера процедура, широко применяемая на практи- ке, требует тщательного и точного анализа переменных (тестов). Нужно докапываться до сущности различных функций, необходимых для вы- полнения содержащихся в тесте заданий, исходя из них при выдви- жении гипотез о системе факторных нагрузок. Уже это является боль- шим достоинством факторного анализа, несмотря на то, что можно под- вергать сомнению ряд его предположений. Поиск общих черт в тестах, имеющих высокие нагрузки по данному фактору, позволяет получить некоторые представления о характере фактора. Однако при незначительных нагрузках такой поиск весьма труден. В этом случае очень легко сделать неправильные выводы. При 114
интерпретации факторов следует, кроме того, учитывать состав группы обследуемых людей. Кеттелл в книге «Factor analysis» (Harper, New York, 1932) приводит несколько юмористический пример влияния вы- борки, служащей основой исследования, на результаты интерпрета- ции факторов. Если изучается выборка, состоящая из двух пьяных и двух трезвых людей, причем один из пьяных пил виски с содовой, а второй — вино с содовой, тогда как трезвые ничего не пили, то по- лучим корреляции, которые укажут на какой-то общий фактор. Этим фактором будут в наибольшей степени загружены переменные «состоя- ния опьянения» и «содовая вода». В этом случае только тот, кто знает, что переменные «виски» и «вино» включают общий фактор — алкоголь, распознает его роль при переменной «состояние опьянения». Только использование достаточно обширной выборки, включающей также людей, которые пили только содовую воду без алкоголя, уменьшит у переменной «содовая вода» нагрузку факторов «опьянения» и особен- но «алкоголь» до минимальных размеров. Трудности, связанные с интерпретацией факторов, можно радикаль- но уменьшить лишь путем дальнейших экспериментов, в процессе которых вводятся новые контрольные переменные. В нашем случае для того, чтобы с большей уверенностью судить о природе спорных факторов (второго и третьего), нужно ввести в ана- лиз новые тесты, являющиеся по возможности «чистой мерой» гипоте- тических влияний. Так как можно подозревать, что второй фактор яв- ляется механическим или пространственным, то нужно увеличить серию тестов, включив в нее наиболее типичные механические тесты и тесты, связанные с пространственным воображением. Что касается третьего фактора, то в этом случае нужно включить новые типичные тесты, построенные на цифровом материале. После исследования и расчетов всех корреляций в расширенной серии тестов нужно еще раз осуществить факторный анализ. Если окажется, что новые меха- нические тесты будут сильнее всего нагружены вторым фактором, то мы будем располагать большими основаниями для предположения, что речь идет о механическом факторе. Если высокие нагрузки будут иметь тесты пространственного воображения, то это будет свидетель- ствовать в пользу пространственного фактора. То же самое можно ска- зать о третьем факторе. Если новые арифметические тесты покажут большие нагрузки этого фактора по сравнению со всеми другими тес- тами, то гипотеза о характере этого фактора найдет яркое подтверж- дение. Ясно поэтому, что одно отдельное исследование никогда не даст достаточных оснований для определения нового фактора. Достоверными могут быть лишь непротиворечивые результаты большого числа работ, выполненных в различных группах обследуемых людей и в раз- ных условиях. В связи с этим необходимо обратить внимание на боль- шие различия в степени устойчивости и общности отдельных факторов. Если фактор последовательно присутствует в весьма широком перечне различных ситуаций и условий, то можно считать, что этот фактор имеет большое влияние и носит постоянный характер. Есть, однако, много факторов, существование которых носит преходящий или ог- 115
раниченный узкими рамками характер, так как они выражают непо- стоянные или связанные лишь с определенным комплексом условий влияния. Так, например, по мнению Фрюхтера, в работах, выполненных методом факторного анализа на основе тестов, реализованных в аме- риканской военной авиации во время второй мировой войны, был выявлен фактор — отчетливый «интерес к пилотажу», который в тот период был характерным постоянным элементом, присущим кандида- там в летчики. Такого рода «локальные» психологические факторы при- сущи всем группам, подверженным определенным однородным влия- ниям и характеризующимся одинаковым уровнем подготовки и одина- ковым общественным положением. Психологов, использующих фак- торный анализ, в большей степени интересуют факторы, имеющие более широкий, всеобщий характер. При этом нужно всегда иметь в виду, что факторы выявляются статистическим путем и их обобщение и интерпретация должны соответствовать общим принципам интерпрета- ции и обобщения данных. Состав факторов данного теста может быть постоянным в некоторой выборке, если она изучается с помощью после- довательных серий с теми же самыми совокупностями факторов. Если, однако, изменить выборку с учетом возраста, образования и других существенных моментов, то можно ожидать изменения факторных на- грузок. В многочисленных работах по факторному анализу в области пси- хологии было вскрыто определенное число как факторов умственных способностей и уровня развития, так и факторов индивидуальных осо- бенностей. Необходимо подчеркнуть, что, вообще говоря, наиболь- шие достижения характерны именно для этих двух областей, хотя во многих странах направления использования факторного анализа в психологии весьма широки и можно встретить даже исследования, посвященные, например, условным рефлексам. Что касается исследования способностей (понимаемых в широком смысле и без каких-либо предположений об их генезисе) в историче- ском разрезе, то целесообразно прежде всего вспомнить выделенные Л. Л. Тэрстоуном семь основных, или первичных, факторов умствен- ных способностей. Тэрстоун был склонен приписывать этим факторам основное значение в формировании индивидуальных различий с точки зрения общей одаренности. Для изучения этих факторов на основе ре- зультатов многочисленных исследований была разработана специаль- ная серия тестов, для краткости обозначенная РМА (Primary Mental Abilities — первичные умственные способности). Перечислим эти ос- новные, по мнению Тэрстоуна, факторы умственных способностей вме- сте с их обозначениями: 1. V — понимание слов. 2. W — беглость речи. 3. N — легкость оперирования цифровым материалом. 4. S — пространственный фактор. 5. М — ассоциативная память. 6. Р — скорость восприятия. 7. R или I — рассуждения или индукция. 116
Два первых фактора представляют собой варианты того, что обыч- но называется словесным или вербальным фактором. Первый из них, обозначенный V, отражает способность правильного понимания слов. Эта способность изучается при помощи различных разновидностей те- стов, часто называемых тестами словарного запаса. Второй, обозначаемый относится к беглости речи или быстроте нахождения слов не толь- ко определенного значения, но и определенных структурных свойств. Примером элемента соответствующего теста может быть, например, задание перечислить как можно больше слов, оканчивающихся на «изм» и содержащих три слога. Третий цифровой фактор N отражает как лег- кость оперирования числами при вычислениях, так и легкость решения арифметических задач. Четвертый фактор S относится к пространствен- ному воображению. Это понятие сложное и его можно трактовать по- разному. В данном случае речь идет об умении ориентироваться в поло- жении предметов относительно самого себя. Пятый фактор связан с ассоциативной памятью, понимаемой как степень связи двух эле- ментов. Обследуемому человеку предлагают пару слов, после чего по прошествии некоторого времени ему повторяют одно из двух слов. Задача состоит в отыскании второго слова. Со времен Тэрстоуна число факторов способностей возросло. Раз- личные факторы, вскрытые в работах ряда авторов, отличаются сте- пенью экспериментальной обоснованности. Так, например, Фрюхтер [84] упоминает, наряду с другими, следующие в достаточной степе- ни обоснованные факторы способностей, выявленные в результате мно- жества работ, выполненных на основе достаточно больших выборок, что дает основание считать эти факторы достаточно устойчивыми: дедукция (общие рассуждения); умение обращаться с механическими устройствами; гибкость в трактовке слитных систем; координация гла- за и руки; психомоторная координация; чувство длины; пространствен- ная ориентация; механическая память (ассоциативная); зрительная память; быстрота формирования и восприятия понятий; понимание слов; суждение; скорость работы и мышления; быстрота схватывания слитных систем; быстрота реакций на наблюдаемые предметы; внима- ние; зрительное воображение; проворность пальцев; ловкость рук. В качестве гипотетических, требующих дальнейшей проверки, фак- торов Фрюхтер приводит, наряду с другими, следующие: время реак- ции; дар речи; оперирование символами; музыкальная память; пол; пунктуация; объединение (интеграция); старательность; быстрота суждений; понимание зависимостей данных наблюдений; способность уловить зависимости между понятиями; способность к подбору экви- валентов; возраст. Некоторые из перечисленных факторов нуждаются в особых пояс- нениях. Например, перечисленные в списке достаточно обоснованные факторы, названные «гибкостью» в трактовке слитных систем и «быстро- той» их схватывания, касаются важной и интересной проблемы в пси- хологии наблюдений. Английский термин «closure» можно тракто- вать как дополнение или понимание слитных систем, структур или «образов», содержащихся в материале наблюдений в неполном или 117
неясном виде. Эта способность изучается при помощи картинок, на которых не совсем ясно изображены какие-либо слитные формы. Перед человеком, проходящим тест, ставится задача раскрыть их. Включенная в первую группу факторов «быстрота формирования и восприятия понятий» напоминает «беглость языка» с той лишь разни- цей, что во втором случае речь идет о структурных свойствах слов (ко- личество слогов, окончания и т. д.), тогда как в первом имеется в виду значение слов. Подвергающийся тесту должен назвать как можно больше слов, значение которых связано с данной темой. Некоторые исследователи утверждают, что приведенные выше фак- торы Тэрстоуна имеют теперь скорее историческое значение. Ведутся интенсивные исследования, в результате которых эти факторы делятся на все более тонкие и обособленные. Так, например, включенный в первую группу фактор «пространственной ориентации» отличается от пространственного фактора S, выделенного Тэрстоуном, тем, что от- носится к способности манипуляции воображаемыми предметами, тогда как фактор S характеризовал ориентацию в положении предметов отно- сительно самого себя. Эта манипуляция воображаемыми предметами представляет собой очень интересный процесс, тесно связанный с тем, что определялось как способность к механике. Было установлено также существование двух отдельных факторов трактовки слитных систем: один связан с пониманием зрительных форм, второй — слуховых. Последний играет важную роль в процессе восприятия на слух. Например, люди с острым слухом «слышат хуже», если они плохо схва- тывают слуховые слитные образы. В отношении процессов рассуждения определены по крайней мере два отдельных фактора: рассуждение де- дуктивное и рассуждение индуктивное. Продолжаются также исследования в области выделения и развития факторов с учетом возраста, пола и среды. Большое количество фак- торов еще нуждается в объяснении и упорядочении. Для иллюстрации напомним конкретный пример выделения факто- ров из определенной серии тестов. Задача заключалась в определении основных способностей, необходимых для прохождения большого чис- ла тестов, используемых первоначально в профессиональной консульта- ции, а также в отборе небольшого числа тестов, являющихся наиболее подходящей «мерой» этих основных способностей, для формирования серии, которая имела бы большое практическое значение1. Для опре- деления факторов был использован центроидный метод Тэрстоуна и вра- щение для получения простой структуры. В результате двух лет кро- потливой работы была представлена серия классификационных тестов, применяемая для профессиональной ориентации в США. Серия состоя- ла из 12 выверенных тестов, являющихся хорошим инструментом из- мерения девяти способностей. Восемь тестов относились к так называ- емым «бумажным», четыре теста имели в своей основе простые аппара- ты. Дадим краткое описание тестов, являющихся последовательными частями серии: 1 По материалам Лаборатории психометрии ПАН. 118
Тест 1. Сравнение названий.1 Подвергающийся тесту должен сравнивать пары названий и определять, есть ли в данной паре какая- либо разница или нет. Показателем будет фактор Q. Тест 2. Набор арифметических упражнений, требующих сло- жения, вычитания, умножения и деления целых чисел. Фактор N. Т е с т 3. Ориентация в трехмерном пространстве. Из четырех рисунков трехмерных предметов нужно выбрать тот, который точно соответствует развертке предмета, изображенного перед рисунками, факторы G и S. Т е с т 4. Тест слов. В наборах из четырех слов нужно определить, какие из них имеют идентичные или близкие значения. Факторы G и V. Тест 5. Наблюдение образов. Из четырех черно-белых чертежей простых устройств нужно выбрать тот, который в точности соответ- ствует изображенном}7 на рисунке. Фактор Р. Тест 6. Серия арифметических задач в устной форме. Факторы G и N. Тест 7. Из двух групп плоских фигур нужно выбрать идентич- ные. Фактор Р. Тест 8. Штриховка. Речь идет о скорости, с которой наносятся значки в квадратах. Фактор К- Тест 9. Использование аппаратуры для исследования индивиду- альных особенностей. Нужно быстро вынимать колышки из ячеек одной таблицы и вставлять в ячейки другой. Фактор М. Тест 10. Нужно как можно быстрее вынимать колышки из ячеек и вставлять их обратным концом. Фактор М. Тест 11. Сборка заклепок и шайб и вкладывание собранных эле- ментов в ячейки таблицы. Фактор F. Тест 12. Разборка собранных заклепок и шайб и распределение их по соответствующим местам. Фактор F. Перечислим эти факторы и дадим их описание и обозначения. G — умственное развитие, понимаемое как общая способность к учебе, восприятию заданий и содержащихся в них правил, а также к рассуждениям и логичным суждениям. Этот фактор измеряется тес- тами 3, 4 и 6. V — способность понимать значения слов и правильно их использо- вать, способность понимать соотношения между словами, а также целые предложения и абзацы текста. Этот фактор характеризует, кроме того, умение ясно выражать мысль. Его измеряет тест 4. N — способность быстро выполнять арифметические задания. Из- меряется тестами 2 и 6. S — пространственное воображение. Речь идет о способности ви- зуального представления геометрических фигур и о способности понять двумерное изображение трехмерных предметов. Этот фактор включает еще один элемент: способность распознавать зависимости, возни- кающие при движении предметов в пространстве. Его измеряет тест 3. Р — наблюдение образов. Способность распознавать и фиксиро- вать детали в изображении предметов или детали на рисунках и кар- 119
тинах. Способность к визуальным сравнениям и различиям. Особое значение имеет умение увидеть тонкие различия в образах и тенях и в толщине и длине линий. Фактор измеряется тестами 5 и 7. Q — «корректорская» наблюдательность. Это название, трудно переводимое с английского, звучит в оригинале как «Clerical Percep- tion» и характеризует способность замечать постоянные особенности письменного и табличного материала. Сюда относится, кроме того, способность видеть различия между оригиналом и копией, корректиро- вать слова и числа и избегать ошибок в процессе арифметических рас- четов. Этот фактор измеряется при помощи теста 1. К. — психомоторная координация. Легкость координирования зрительной информации с правильными и быстрыми движениями рук или пальцев. Способность правильно и ловко выполнять двигательные реакции. Этот фактор связан со временем реакции. Измеряется тестом 8. F — ловкость пальцев. Способность быстро и правильно двигать пальцами и манипулировать малыми предметами при помощи пальцев. Этот фактор измеряется тестами 11 и 12. М — ловкость рук. Способность быстро и ловко двигать руками. Особенно это касается передвижения вручную мелких предметов с ме- ста на место и их перевертывания. Фактор измеряют 9-й и 10-й тесты. Вышеописанные факторы признаны существенными для широкого круга специальностей. Результаты основывались на выборках, состоя- щих из тысячи обследуемых людей. Перейдем теперь к описанию некоторых достижений в области фак- торов индивидуальных особенностей. Эта проблема сложнее, чем в слу- чае способностей, а результаты менее заметны. Составлено много переч- ней гипотетических факторов индивидуальных способностей. Две- надцать факторов (наряду с другими) были описаны Кеттеллом. Это так называемые биполярные факторы, встречающиеся, как правило, в области исследования индивидуальных особенностей. Эти факторы можно определить, характеризуя предельные противоположные свойства. Факторы Кеттелла таковы: 1) циклотимия — шизотимия; 2) развитые умственные способности — умственная отсталость; 3) эмоциональная зрелось — общее непостоянство и эмоциональная незрелость, 4) доминирование — подчинение; 5) хорошее самочувствие — меланхолическая депрессия; 6) повышенная чувствительность, робость — сильное, устойчивое эмоциональное равновесие; 7) высокий уровень развития и участия в общественной жизни — простота (примитивизм); 8) самостоятельный и внутренне уравновешенный характер — не- зрелый и несамостоятельный характер; 9) общительный, бурный циклотимический характер — сдержанный негативпстический шизотимическпй характер; 10) неврастения — детерминированный и бодрый характер; 120
11) инфантильная, впечатлительная чувствительность — флегма- тичный, пессимистический душевный холод; 12) циклотимия — пароноидальный характер. Очевидно, можно много дискутировать по поводу этого перечня и использованных терминов. Такая дискуссия не входит в нашу задачу, так как мы хотели на конкретном примере охарактеризовать прежде всего результаты факторного анализа индивидуальных способностей. Исследования в этой области продолжаются и приносят все время новые результаты. Можно ожидать, что приведенные в качестве примера пе- речни факторов способностей и индивидуальных различий будут под- вергаться существенным модификациям. Существуют также интересные работы, например в области социаль- ной психологии, где встречаются родственные проблемы изучения общественного положения и свойств личности. В таких случаях иногда удается определить специфичные факторы. Примером работы такого типа может быть исследование Е. Терри Протро по вопросу об отноше- нии арабских студентов к различном}' образу жизни (Arab students choices of ways to live «The, Jornal of Social Psychology», v. 47, February 1958, Provincetown, Massachusetts USA). Сто арабских студентов муж- ского пола оценивало 12 характеристик «различных стилей жизни» по 7-балловой шкале. Результаты сравнивались с аналогичными оцен- ками студентов других семи стран. Оказалось, что студенты-арабы выше всего ценят характеристики, отражающие активное начало, кол- лективизм, самоконтроль. В то же время они отвергают путь созерца- ния, индивидуализма и беззаботной жизни. Интересно то, что центро- идный метод Тэрстоуна, использованный для интерпретации результа- тов описываемых здесь исследований, позволил выделить пять орто- гональных факторов: I — уверенность в себе; II — радость жизни; III — простота и умеренность; IV — интроверсия—экстраверсия; V — динамическая интеграция. Последний фактор интерпретировался как динамическое объеди- нение радости жизни, деятельности и созерцания Последнее нужно понимать в общепринятом смысле пассивного переживания ситуации в сочетании с размышлением, но без готовности действовать. Приведенные факторы объясняют корреляции между оценками, которые группа обследуемых лиц дает двенадцати характеристикам типа: «потребность в постоянной активности», «связь с общественной группой», «переживание — товарищество», «умеренность, сдержан- ность и интеллигентность» и т. д. Применялась такая шкала оценок: 1 — означало «я это очень не люблю»; 4 — означало «мне все равно»; 7 — означало «я это очень люблю». Значимость отдельных характеристик стилей жизни определялась различными нагрузками выделенных факторов. Например, высокая нагрузка фактора III соответствовала элементу «умеренность, сдержанность и интеллигентность». Примеров использования факторного анализа для психологических и социологических исследований очень много. Рамки данной работы вы- нуждают нас ограничиться теми их них, которые были разобраны выше. 121
Глава седьмая ДРУГИЕ МЕТОДЫ ОПРЕДЕЛЕНИЯ ФАКТОРОВ 1. ВСТУПИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О ПУТЯХ РАЗВИТИЯ ФАКТОРНОГО АНАЛИЗА Уже отмечалось, что описанный выше в общих чертах центроид- ный метод выделения факторов из совокупностей корреляции между переменными не является единственным методом факторного анализа. Указывалось также, что в рамках данной работы с учетом ее размеров и того, что она носит характер вступления в проблему, нет возможно- сти детально рассматривать другие методы, используемые на практике. Однако представляется целесообразным дать хотя бы самую общую ха- рактеристику важнейших из них в целях лучшего и всестороннего из- ложения сущности центроидного метода, представляющего собой са- мый распространенный вариант процедуры многофакторного анализа. Чтобы смысл названия «многофакторный анализ» стал еще яснее, не- обходимо вернуться немного назад. Мы уже знаем, что начало разви- тия факторного анализа было положено Чарльзом Спирмэном [174]. Эта работа послужила первым толчком к возникновению бурно развивающегося направления исследований и оживленных дискус- сий, в которых скрестили шпаги сторонники многих новых концепций факторного анализа. Попытаемся сжато изложить исходную теорию Спирмэиа и условия, в которых она возникла. Спирмэн был одним из первых исследователей, выдвинувших задачу определения факторов, обусловливающих экспериментально обнаруженные корреляции. Внимание этого ученого привлек тот факт, что тесты способностей характеризуются, как правило, заметными положительными корреля- 122
циями. Это наводило на мысль, что все эти возможные совокупности кор- реляций обусловливаются каким-то одним общим фактором, влияющим на все переменные. Возникла задача обосновать этот тезис с математи- ко-статистической точки зрения. Психологам, применявшим статисти- ческие методы, уже давно была известна зависимость величины коэффи- циента корреляции от надежности коррелируемых тестов способно- стей. Коэффициент этот тем выше, т. е. ближе к своему максимально возможному в данных условиях значению, чем выше надежность (постоянство) тестов, измеряющих две способности. Если применяются тесты, дающие погрешности и характеризующи- еся низкими коэффициентами надежности, и если тесты реализуются в неодинаковых условиях, то корреляция между ними будет занижена в результате ошибок наблюдения. Правильно рассчитанная корреля- ция является показателем некой закономерности, некой структуры в потоке событий, а всевозможные неточности, случайные помехи из-за разного рода ошибок всегда снижают значение коэффициента корре- ляции. Этого нельзя сказать в отношении многих других статистиче- ских величин, например, в отношении средней, так как случайные ошибки могут как уменьшать, так и увеличивать ее. Так же давно был известен метод корректировки отклонения коэф- фициента корреляции от его теоретической величины, обусловлен- ного ошибкой эксперимента. Существует формула, позволяющая опре- делить теоретическое значение г, т. е. величину этого коэффициента, при отсутствии ошибок. Формула эта довольно сложная, она имеет вид: У (ra' b’)(ra' b")(ra" Ь’)(га" Ь"') ^ab п /-----77----г ’ V • Ч У 1га' а"^гЬ' Ь") где а' и а" — два последовательных наблюдения способности а, содер- жащей определенный процент ошибки, Ь' и Ь" — наблюдения способ- ности Ь. Мы не будем подробно рассматривать математические основы этой формулы; наша цель заключается прежде всего в определении роли, которую она играет в исследованиях Спирмэна. Поэтому ука- жем лишь, что числитель формулы включает все скорректированные комбинации отдельных наблюдений, тогда как знаменатель содер- жит два коэффициента надежности. Чем выше эти коэффициенты, тем ближе экспериментально определенные г к теоретической величине г. Трактуя эту формулу несколько иначе, Спирмэн вывел свое зна- менитое уравнение тетрады (tetrad difference equation). Дадим в сжа- той форме основную последовательность рассуждений, которой при- держивался Спирмэн, не вдаваясь в алгебраические преобразования. Он рассматривал приведенную формулу как метод расчета корреляции, возникающей между двумя тестами, включающими один и тот же общий фактор, при условии, что элиминированы специфичные соответству- ющие обоим тестам факторы. Спирмэн, следовательно, считал, что эле- менты, специфичные для данного теста, в случае измерения общего фактора, играют ту же роль, что и ошибки измерения. Поэтому можно рассмотреть какие-либо четыре теста, в отношении которых допуска- 123
ется, что они содержат общий фактор, и интерпретировать их как со- ответствующие наблюдения, обозначаемые а', а", Ь', Ь". Это будут также различные способы измерения одного и того же явления (общего фак- тора), но при помощи четырех различных тестов. Поэтому указанное уравнение будет способом определения общности в каждом тесте. Для этой новой трактовки формулы целесообразно использовать другие обозначения, чтобы замысел Спирмэна стал более явным. Вме- сто а', а", Ь' и Ь", обозначающих четыре наблюдения двух способностей, используем номера 1, 2, 3, и 4, обозначающие четыре различных теста, подобранных так, чтобы с помощью каждого из них можно было попы- таться измерить один и тот же фактор. Этот общий фактор Спирмэн обозначил g. В результате левая сторона исходного уравнения будет иметь вид rgg, так как в соответствии с нашим предположением все четыре теста являются попыткой измерения одного и того же фактора g\ другими словами, g в тесте 1 и 2 то же, что и g в тесте 3 и 4. Поэтому __ V(''1з)(ггз)(Г1д)(г24) 88 УШ ( ) При этом произвольные коэффициенты г12 и г34 рассматриваются как аналоги коэффициентов надежности. С тем же успехом можно исполь- зовать коэффициенты г13 и г24 или г14 и г23. Отсюда следует, что при- веденную формулу можно записать в трех вариантах. Понятно, что левая сторона формулы rgg отражает корреляцию фактора g с ним са- мим, а потому можно принять, что она равна 1. Путем ряда преобразований из формулы можно получить следую- щую пропорцию: г 13 г14 — > r23 г24 которую легко переписать в виде Г13 ’ r2t - 6l4 ‘ ^23 = 0. Последнее выражение и есть знаменитая тетрада Спирмэна. Если корреляции четырех отдельных тестов удовлетворяют этому уравне- нию, то все тесты измеряют только один общий фактор. Кроме того, они измеряют специфичные факторы, присущие каж- дому их них. Возьмем в качестве примера простую систему корре- ляции четырех тестов. Таблица 7.1 Тесты 1 2 3 4 1 X Г12 Пз Г14 2 г21 X г23 г24 3 Гз1 f 32 X г34 4 Гд! Г42 г43 X 124
Как при помощи метода Спирмэна определить, можно ли для всех коррелированных тестов исходить из существования общего фактора? Нужно взять тесты во всех возможных комбинациях (каждый раз по четыре) и проверить, будут ли все тетрады равны нулю. Если будут, то коэффициенты каждых двух столбцов (не считая пустых клеток на главной диагонали) будут пропорциональны друг другу. Для столб- цов 1 и 2 получим: Гл 1 = — , ИЛИ Га1-Г42=г-Г32Т41. г32 Г42 Для столбцов 1 и 3 получим: — , или Г21-Г43=г23-Г41. Газ '«3 Для столбцов 1 и 4 получим: — = ИЛИ г21 ^34 = ^4^31. г 24 г34 Отсюда непосредственно определяем тетрады: ^31*612 Г32'^41 = г2г^з — г2з‘Га = 0; r21'rSt - r24'r31 = 0- , Аналогичные уравнения можно, очевидно, написать для столбцов 2 и 3, 2 и 4, 3 и 4, но они будут повторять уже приведенные уравнения. При выполнении выписанных уравнений считаем, что условие пропор- циональности соблюдено и что четыре изучаемых теста имеют один общий фактор. При большем числе тестов количество таких формул быстро растет, так как нужно проанализировать все возможные комбинации по 4 тес- та одновременно. Например, при 10 тестах количество уравнений составит 252, при 20 тестах — 2907. Каждый из п тестов вхо- дит в 1/s (и — 1) (п — 2) (п — 3), а каждый коэффициент корре- ляции—в (п—2) (п— 3) соответствующих уравнений. Видно, что этот метод весьма трудоемок. Рассмотрим еще одно понятие, связанное с методом Спирмэна, что- бы все приведенные выше пропорции были более выразительными, заметными как бы с ««первого взгляда», столбцы и строки матрицы Должны располагаться в определенном порядке. На первом месте дол- жен находиться столбец с наибольшей суммой коэффициентов кор- реляции, дальше идти столбцы с последовательно уменьшающимися суммами. При таком подходе в каждых столбце и строке коэффициенты корреляции будут ранжированы в порядке убывания. Такое упорядо- чение Спирмэн назвал «иерархической системой». Попытаемся проиллюстрировать сказанное на условном числовом примере. 125
В случае матрицы корреляции пяти переменных, записанной в виде табл. 7.2, вычисляются прежде всего суммы отдельных столбцов, после чего столбцы и соответствующие им строки меняются местами с учетом сумм их элементов. В результате получим табл. 7.3. Таблица 7.2 Тесты а ъ С а е Суммы строк а 0,48 0,24 0,54 0,42 1,68 ь 0,48 X 0,32 0,72 0,56 2,08 с 0,24 0,32 X 0,36 0,28 1,20 d 0,54 0,72 0,36 X 0,63 2,25 е 0,42 0,56 0,28 0,63 X 1,89 Суммы столбцов 1,68 2,08 1,20 2,25 1,89 Таблица 7.3 Тесты 1 (<1) 2 (Ь) з (е) 4 (а) 5 (с) Суммы строк 1 (d) X 0,72 0,63 0,54 0,36 2,25 2 (Ь) 0,72 X 0,56 0,48 0,32 2,08 3 (е) 0,63 0,56 X 0,42 0,28 1,89 4 (о) 0,54 0,48 0,42 X 0,24 1,68 5 (с) 0,36 0,32 0,28 - 0,24 X 1,20 Суммы столбцов 2,25 2,08 1,89 1,68 1,20 В этой «иерархической системе» пропорциональность каждых двух столбцов и строк более очевидна, что легко проверить с помощью со- ответствующих расчетов: = т. е. 0,56-0,54 = 0,63.0,48 0,56 0,48 ИЛИ ОТгдЦбЗ т 0,72-0,28=0,32-0,63 и т. д. 0,32 0,28 Для корреляций, полученных на основе реальных данных, не существует, видимо, таких совершенных иерархических систем, хотя Спнрмэн и его последователи нашли некоторое число тестов способ- ностей, которые давали корреляции, характеризующиеся заметной тенденцией к такой пропорциональности. Тетрады разности в этом слу- чае незначительно отклонялись от нуля, причем эти отклонения не выходили за границы допустимой ошибки. С учетом этих результатов 126
была сформулирована известная «теория двух факторов», предполага- ющая, что каждый тест, входящий в «иерархию», включает два фактора: gt s. Фактор g— это «фактор общей одаренности», фактор s — это специфичный для каждого теста фактор, соответствующий только ему и только той части дисперсии, которая характерна для данного теста. Эту теорию более правильно было бы назвать теорией одного общего фактора и теоретически неограниченного числа специфических фак- торов, которых может быть столько, сколько вообще можно себе пред- ставить тестов. Спирмэн стремился очищать серию тестов от тех из них, которые нарушают иерархию, используя для этой цели критерий тетрад. Непод- ходящие тесты, помимо общего фактора, включали еще какой-то фактор, общий для меньшей группы тестов. Ясно, что если две перемен- ные, помимо общего фактора, объединяющего их со всеми переменны- ми матрицы, имеют еще какой-то дополнительный фактор, связываю- щий эти две переменные друг с другом, то корреляция между ними будет чрезмерно высокой и исказит пропорциональность. С этой точ- ки зрения тетрада в течение многих лет выполняла роль критерия «иерархической системы». Существенный поворот произошел тогда, когда Тэрстоун предложил другое применение этого инструмента. Он обратил внимание именно на те тесты, которые Спирмэн и его уче- ники устраняли из серии при помощи правила тетрады. Они заинтере- совали Тэрстоуна с точки зрения, содержащихся в них дополнительных групповых факторов. Теперь указанные разности стали средством ис- следования дополнительных групповых факторов, содержащихся в данной серии. Эти факторы ранее элиминировались путем устра- нения переменных, нарушающих иерархию. Вместо того, чтобы под- гонять совокупность корреляций с учетом рамок, обусловленных кон- цепцией общего фактора, Тэрстоун стремился найти все факторы, которые действительно могут содержаться в корреляциях данной груп- пы переменных. Таким путем и возник замысел многофакторного ана- лиза. Много времени продолжалась дискуссия между сторонниками Спирмэна и Тэрстоуна. В эту дискуссию были вовлечены многие спе- циалисты факторного анализа, разделившиеся на противоборствующие лагери и защищающие противоположные концепции. И лишь по мере разработки теоретических основ становилось понятно, что концеп- ция многофакторного анализа представляет собой просто обобще- ние идеи Спирмэна. Однако до сегодняшнего дня сохранились не- которые тенденции, являющиеся эхом прошлых противоречий. Ан- глийская школа факторного анализа склонна оперировать общим фак- тором, тогда как американская школа стоит на платформе многофак- торного анализа в его чистом виде. Попытаемся выяснить, почему концепция общего фактора явля- ется особым случаем многофакторного анализа. Для того, чтобы чита- тель смог получить представление о связи между концепциями Спир- мэна и Тэрстоуна, введем некоторые общие сведения по проблеме, ко- торые помогут исследователю ориентироваться в том случае, когда он обратится к литературе. 127
2. МНОГОФАКТОРНЫЙ АНАЛИЗ И КОНЦЕПЦИЯ СПИРМЭНА Приступая к рассмотрению проблемы, нужно ответить на вопрос, который иначе может явиться источником ряда недоразумений. Выше мы часто пользовались терминами «генеральный фактор», «общий фак- тор», «групповой фактор». Дадим определения этих названий в соответ- ствии с тем смыслом, с которым они используются в факторном анализе. В основу положим отношение фактора к определенному множеству переменных. «Генеральным» называется фактор, относящийся ко всем переменным данной матрицы. «Общим» называется фактор, относящийся по край- ней мере к двум переменным. «Специфичным» называется фактор, от- носящийся лишь к одной переменной-, о его существовании свидетель- ствует то, что всю дисперсию данной переменной нельзя приписывать общим факторам. Отметим, что образующийся остаток распадается на специфические изменения и ошибки. Значение термина «групповой фактор» близко к значению термина «общий фактор». Он используется в первую очередь там, где речь идет о чем-то общем, какой-то опреде- ленной группе переменных. Например, группа арифметических тестов в большой серии тестов интеллектуальных способностей может быть помимо общего, присущего всем тестам серии, образующих матрицу, дополнительно связана групповым числовым фактором N. Здесь нужно отметить некоторые более общие понятия. Противо- поставление генерального и групповых факторов горячо дискутирова- лось во времена Спирмэна и в последующий период. Это объяснялось тем, что первоначальная трактовка генерального фактора была в не- котором смысле абсолютной, другими словами, школа Спирмэна виде- ла в нем фактор, относящийся ко всем возможным тестам. Однако даль- нейшее развитие показало, что термин «генеральный фактор» имеет ско- рее всего относительное значение. То «общее», что есть в данной серии переменных, в большой степени зависит от подбора этих переменных. Если в матрицу записать корреляции лишь тестов интеллектуальных способностей, то общим фактором будет показатель g Спирмэна. Если подобрать одни тесты механических способностей, то общим будет фак- тор механических способностей М. С этой точки зрения более целесообразно подчеркивать относи- тельное значение терминов «генеральный» и «групповой» факторы при- менительно к некоторым корреляционным матрицам. В более широком смысле лучше говорить об общих факторах, соответствующих большей или меньшей группе переменных. Такие же мысли вызывает понятие «специфичные факторы». Обыч- но они трактуются как неповторимые. Однако во многих случаях они могут рассматриваться как общие факторы, соответствующие малым группам. Если в состав серии тестов интеллектуальных способностей ввести тест ловкости пальцев, то, несомненно, ему будет соответствовать большая специфичность. Напротив, тот же тест в группе различных тес- тов ловкости и координации движений будет характеризоваться пре- обладанием общности. Специфичность этого теста передается в значи- 128
тельной степени родственным тестам. Представляется, что генераль- ные, групповые и специфичные факторы можно понимать в широком смысле как общие, различающиеся соответствующими группами пе- ременных. Вернемся к главной проблеме соотношения многофакторного ана- лиза и обобщения концепции Спирмэна. Для этого вспомним понятие ранга матрицы. Как определить ранг матрицы? Это можно делать, также формулируя все возможные тетрады для данной корреляцион- ной матрицы и определяя, будет ли каждая из них в точности равна нулю. Если выписанные выше уравнения справедливы, то ранг мат- рицы не превышает 1. В терминах факторного анализа это означает, что матрица содер- жит один общий фактор в соответствии с критерием «тетрад» Спирмэна. Если по крайней мере одна из них не равна нулю (опуская ошибку вы- числений), то ранг матрицы не меньше 2. Дальнейшее исследование матрицы представляет собой довольно трудную проблему. Необходимо вычислять величины всех тетрад, которые не равны нулю, и соста- вить из них новые тетрады. Если эти уравнения равны нулю, ранг матрицы не превышает 3. Что это означает? Приведем часто цитируемые слова Тэрстоуна из введения к его основной работе по многофакторному анализу [203]: «В 1931 г. было решено исследовать зависимость между многофактор- ным анализом и тетрадами Спирмэна. Когда я выписал это уравнение, чтобы приступить к исследованию, то заметил, что оно является по- просту развернутой формой минора второго порядка. После этого связь стала очевидной. Можно было бы выдвинуть ряд предположений о том, насколько ускорилось развитие факторного анализа, если бы это от- крытие было сделано раньше. Если для определения одного общего фактора должн быть равны нулю миноры второго порядка, то должны ли быть равны нулю при определении двух общих факторов миноры третьего порядка? Такой подход к проблеме ускорил бы ее решение, так же как и устранил бы препятствия на пути развития многофактор- ного анализа. Вместо того, чтобы оперировать пропорциональными столбцами и строками иерархии и нулевыми тетрадами, в настоящее время мы используем те же зависимости, опираясь на свойства ранга, равного 1, заключающиеся в пропорциональности столбцов и строк, и нулевых миноров второго порядка; этот подход можно распростра- нить на случай более высоких рангов». Так Тэрстоун характеризует сущность проблемы. Необходимо добавить, что, как уже указывалось, ранг матрицы представляет собой попросту число линейно независимых строк или столбцов. В матрице с рангом 1 лишь одна строка линейно независима, так как все другие строки могут быть выражены через нее (см. гл. II, раздел «Ранг мат- рицы»), Понятно, что в этом случае соответствующие пары столбцов или строк будут пропорциональны. Для объяснения всех корреляций, рассчитанных в.результате эксперимента или наблюдений и содержа- щихся в такой матрице, достаточно одного фактора или измерения. 5 Зак. 377 129
Это открытие Тэрстоуна, сделанное в 1931 г., явилось переломным моментом в развитии многофакторного анализа. Оказалось, что ранг матрицы соответствует числу факторов, необходимых для объяснения данной совокупности корреляций. Спирмэн, сделавший далеко иду- щие выводы из своей концепции одного общего фактора, попросту опе- рировал матрицей, ранг которой был равен 1. Так возник многофакторный анализ, значительно расширивший возможности применения факторных методов прежде всего в психоло- гии. Используя матрицы более высоких рангов, многофакторный ана- лиз позволил изучать одновременно много влияний и выявлять их вза- имосвязи и зависимости. 3. ГЛАВНЫЕ РАЗНОВИДНОСТИ МЕТОДОВ ОПРЕДЕЛЕНИЯ ФАКТОРОВ Уже отмечалось, что рамки данной работы не позволяют подробно изложить большую часть методов факторного анализа. Рассмотрим поэтому несколько более подробно метод главных осей, после чего попытаемся дать лишь в самой общей форме классификацию существу- ющих методов, которая поможет читателю ориентироваться в обшир- ной литературе по предмету при изучении конкретных проблем. Предпринимая попытку иллюстрации факторного анализа на кон- кретном примере, мы по необходимости ограничились лишь центроид- ным методом, учитывая широкие возможности его применения в пси- хологии. Однако помимо этого весьма распространенного метода многофакторного анализа существуют родственные ему методы, опирающиеся на ту же самую основополагающую концепцию. Тэр- стоун дает еще четыре таких метода. Один их них — так называемый диагональный метод — имеет скорее всего лишь историческое значение, тогда как три остальных сохраняют большое практическое значение, являясь в некотором смысле сокращенными вариантами центроидного метода. Названия этих методов похожи друг на друга: методы групп, методы группировки и методы многократных групп. В отличие от цен- троидного эти методы не используют с самого начала всю корреляци- онную матрицу для определения области общих факторов, а исходят из поисков выразительных связок корреляции, свидетельствующих о на- личии основ скрытой структуры. С учетом этого ведется дальнейший анализ факторов. Такой подход и составляет, видимо, главную осо- бенность этих методов, отличающую их от центроидного и позволяю- щую рассматривать их как более экономные способы определения фак- торов. Так как при этом берется лишь часть корреляционной матрицы, отпадает необходимость в расчете средней корреляции одновременно всех переменных. Важным свойством всех трех методов является также то, что соответствующее им положение системы координат близко к про- стой структуре, т. е. исходная факторная матрица близка к матрице после поворота. Причина этого достаточно ясна. Если на первой ста- дии работы учитываются связки корреляций, то процесс выделения 130
факторов из этих связок дает довольно высокие нагрузки определен- ного фактора для всех переменных в связке и незначительные нагруз ки этого фактора при переменных, не входящих в связку. А именно это и есть свойство простой структуры. Близкое еще не означает точно та- кое же, и это нужно всегда помнить. Для каждого такого метода харак- терно то, что некоторые факторы, содержащиеся в корреляционной матрице, не входят в определенные связки и в то же время некоторые связки могут содержать более одного фактора. В любом случае то, что указанные методы дают положение осей координат, близкое простой структуре, является желательным в том смысле, что окончательное положение можно определить при помощи меньшего числа вращений, чем при центроидном методе. Не вдаваясь в дальнейшие подробности, укажем еще, что недостатком этих методов является большая трудность их использования. Выбор групп для анализа представляет собой в определенном смысле искус- ство и требует лучшей подготовки и большего опыта у исследователя, чем в случае более формализированного центроидного метода. Кроме того, труднее определить исходную общность, которая в этом случае должна рассчитываться более точно. Из методов, опирающихся на иные по сравнению с описанными выше процедуры семейства «центроидных методов», можно отметить метод главных осей1. Создателем его является Г. Хотеллинг. Т. Келли внес в него ряд улучшений при анализе социально-психологических данных. Этот метод больше всего известен математикам, с точки зрения ко- торых он является одним из главных в факторном анализе. В его осно- ве лежат совершенно другие предположения по сравнению с центро- идным методом. Процедура расчета факторных нагрузок методов главных осей весь- ма трудоемка при отсутствии современных вычислительных машин. Однако более подробное ознакомление читателя с техникой расчетов, необходимых при использовании этого метода, представляется целе сообразным как с точки зрения его теоретического значения, так и с учетом необходимости более детального рассмотрения хотя бы одного примера расчета факторов, опирающегося на другие, по сравнению с центроидным методом, предположения. В работе Б. Фрюхтера [84] дан пример расчета факторных на- грузок методом главных осей, там же описан метод Хотеллинга и Келли, отличающийся интересными свойствами. Наиболее существенно, пожалуй, то, что этот метод позволяет определить факторы, объясня- ющие максимальную область дисперсии и дающие минимальные остат- ки в корреляционной матрице. С точки зрения расчетов это означает, что сумма квадратов факторных нагрузок будет максимальной для каждого фактора. Из этого вытекает, что матрица может анализиро- ваться при помощи минимального числа ортогональных факторов. 1 В современной практике обычно используется некоторая мо.чификапия это- го метода — метод главных компонент, описанный автором на стр. 133—Прим, ред. 5* 13]
К несомненным преимуществам этого метода относится и то, что расче- ты дают решение, которое с чисто математической точки зрения явля- ется однозначным для данного набора корреляций. Б. Фрюхтер высказывает мнение, что метод главных осей может быть в некотором смысле заменен центроидным, требующим меньших расчетов. Если при помощи центроидного метода выделяется один или два положительных фактора, то получается решение, которое с учетом области вычисленной дисперсии более или менее эквивалентно решению по методу главных осей. Нужно, однако, помнить, что предположения обоих методов совершенно различны, а потому различны и возможности содержательной интерпретации рассчитанных факторов. Считается, что дать интерпретацию факторов, рассчитанных методом главных осей, гораздо труднее по сравнению с центроидными факторами. Метод расчета факторных нагрузок был разработан Хотеллингом в 1935 г. Этот метод основан на принципе последовательных прибли- жений и позволяет достичь любой степени точности. На главной ди- агонали корреляционной матрицы записываются общности, относитель- но которых предполагается, что они истинны. В результате способ полу- чения редуцированной корреляционной матрицы точно такой же, как и в центроидном методе. Процедура расчетов при этом распада- ется на два основных этапа: первый из них представляет собой процесс вступительных итераций, т. е. многократного повторения одной и той же расчетной операции для определения достаточно точных значений, необходимых при вычислении факторных нагрузок, второй этап и есть расчет этих нагрузок. Факторная матрица, рассчитанная методом главных осей, имеет интересное свойство: сумма произведений каждой пары ее столбцов равна нулю. Другая особенность относится к сумме квадратов факторных на- грузок каждого столбца факторной матрицы. Эти величины называ- ются «скрытыми корнями». Каждая из них соответствует той части полной дисперсии всех тестов, которая приходится на данный фактор. Если величины 2С2 для разных столбцов, соответствующих отдельным факторам, неодинаковы, то значения строки и будут быстро стремиться к требуемой степени точности в процессе последовательных приближе- ний. Если суммы квадратов факторных нагрузок равны, то ситуация менее благоприятная, так как элементы строки и очень медленно при- ближаются к требуемому уровню точности. Редуцированная факторная матрица, полученная методом главных осей, может быть преобразована с учетом правил вращения, описанных в пятой главе (стр. 90). Этим путем можно определить такое положение осей системы координат, при котором набор факторных нагрузок в наибольшей степени соответствует потребностям психологической интерпретации. Метод главных осей имеет еще одно применение. Если на главной диагонали исходной корреляционной матрицы записать единицы или на- дежности тестов, то анализ методом Хотеллинга приведет к определе- на
нию так называемых главных компонент1. Поэтому этот метод называется методом главных компонент. Если главная диаго- наль корреляционной матрицы состоит из единиц, то перед на- ми полная матрица анализ которой дает столько факторов, сколько имеется переменных (тестов). Если попытаться гео- метрически описать проблему, то окажется, что в случае мето- да главных компонент в качест- ве осей координат берутся не оси, соответствующие факторам, а векторы, соответствующие пе- ременным. Если предположить, что векторы переменных перпендикулярны друг другу, то точки, соответствующие отдельным наблюдениям (например, результаты ряда лиц в данном тесте), в случае положительной корреляции будут об- разовывать фигуру, напоминающую эллипс (рис. 7.1.). Оси, представляющие факторы, проводятся вдоль и поперек эллип- са (CjCJ и С2Сг на рис. 7.1), т. е. в соответствии с положением его боль- шой и малой осей. Этим и объясняется общее название метода. Теперь можно проецировать все наблюдения (например, оценки отдельных лю- дей в соответствующих тестах) на оси факторов. Если к двумерной си- стеме добавить вектор третьей переменной, перпендикулярной к двум первым векторам, то получим трехмерную систему, в которой множество точек будет иметь вид яйцеообразного тела — эллипсоида. Добавляя следующие векторы, соответствующие всем переменным в матрице, получим в итоге «конфигурацию» векторов в n-мерном про- странстве. Это пространство будет иметь столько осей,сколько перемен- ных в матрице. Поэтому метод главных осей дает столько факторов, сколько переменных. Как уже отмечалось, результаты всех факторных методов могут быть взаимно преобразованы друг в друга. Теперь можно, кроме того, указать, что они могут преобразовываться в общую структуру, которая будет простой. В качестве еще одного трудного, но восхваляемого математиками метода можно отметить метод максимального правдоподобия Лоули, с помощью которого можно математически строго определить факторные нагрузки. Этот метод был описан Томсоном [192] и Лоули [128]. В самой сжатой форме этот метод можно описать следующим образом: анализ начинается с первого приближения факторных нагрузок, рассчитанных любым методом, например центроидным. Затем путем последователь- 1 При использовании метода главных компонент отправным моментом ана- лиза является матрица ковариаций, а не матрица корреляций. — Прим. ред. 5В зак. 377 133
ных приближений получим все более однозначно определенные фактор- ные нагрузки. В конечном итоге получаем надежные опенки числам характера факторов, содержащихся в корреляционной матрице. Сле- дующим шагом может быть вращение факторов для определения поло- жения, позволяющего дать наилучшую содержательную интерпре- тацию факторов. В заключение напомним еще о методах, родственных первой в исто- рии факторного анализа концепции Спирмэна. Здесь можно отметить двухфакторный метод и метод биполярных факторов. Классический метод Спирмэна имеет сегодня сугубо историческое значение как ил- люстрация путей развития факторного анализа. Однако основная идея Спирмэна, связанная со специфическими проблемами исследования ум- ственных способностей, была развита К- Холзингером [105]. Это развитие старой идеи, позволяющее расширить область ее применения, иногда связывается с двухфакторным методом. По этому методу процедура начинается с определения нагрузок генерального фактора, присущего тестам, не нарушающим иерархию. На следующем шаге принимаются во внимание переменные, нарушающие иерархию Спирмэна, для определения дополнительного влияния, оказываемого групповым фактором на корреляции, включенные в матрицу. Генераль- ный фактор является при этом основой, на которой надстраиваются взаимно не совпадающие групповые факторы. Вычислительные опера- ции при определении факторных нагрузок по этому методу проще, чем в центроидном методе. Остается еще добавить, что система таких фак- торов называется в специальной литературе системой «пустых ступе- ней». Смысл этого образного определения будет объяснен ниже. Обратимся к методу биполярного фактора, развитого С. Бартом (Burt С. L. Factor of the mind, London, 1940, University of London Press). Этот метод трудно отнести к тому или иному типу, так как он связан одновременно с концепциями общего фактора Ч. Спирмэна и К. Холзингера и с центроидным методом в процессе определения сле- дующих факторов. Не вдаваясь в подробности метода, укажем лишь, что он связан с понятием так называемых биполярных факторов. Это означает, что каждый фактор имеет специальную систему положитель- ных и отрицательных нагрузок у всех переменных. Эта система харак- теризуется тем, что каждый следующий фактор среди нагрузок преды- дущего фактора с одинаковым знаком делает одну половину отрица- тельной, а вторую положительной. Так как нагрузки первого общего фактора всегда положительны, половина нагрузок второго фактора положительна, а половина отрицательна. Связанное с этим методом по- нятие биполярного фактора имеет значение в исследовании структуры индивидуальных особенностей, так как здесь мы имеем «биполярность» основных черт, например доминирование — подчинение, интровер- сия — экстраверсия, эмоциональная возбудимость — эмоциональное равновесие и т. д. Интересно, что, по мнению С. Барта, этот метод, как и описанный выше двухфакторный метод, дает с самого начала наборы факторов, поддающихся содержательной интерпретации без вращения осей ко- 134
ординат. Кеттелл придерживается иной точки зрения, полагая, что процесс вращения необходим во всех случаях. На этом мы заканчиваем беглый обзор основных методов факторно- го анализа. Было бы целесообразно провести сравнение существующих методов еще с одной очень важной точки зрения, позволяющей лучше уяснить взаимосвязи между ними. Речь идет о созвездии факторных нагрузок. Этот термин применяется большинством авторов для таблиц, характеризующих план размещения нагрузок данного множества фак- торов по отношению к совокупности переменных с учетом положитель- ных, отрицательных и нулевых нагрузок. Различные факторные методы приводят, как известно, к разным созвездиям факторных на- грузок, или (на языке геометрии) к различным положениям осей систе- мы координат перед вращением. Можно осуществить графическое со- поставление различных созвездий факторных нагрузок при помощи специальных таблиц, в которых нагрузки обозначаются условным знаком. В принципе возможных созвездий больше, чем созвездий, кон- кретно определяемых в соответствии с фактами и законами статисти- ки. Ниже приводится такое сопоставление только тех созвездий, ко- торые соответствуют некоторым из описанных выше методов (табл. 7.4). Таблица 7.4 Переменные Факторы Ci С, С4 ! С„ С, | С, С, 1 * * * * * 2 & * * * * Я: 3 * * * * * 4 * Я: * * & 5 * * * * * 6 * * * * * 7 * * * * * 8 * * * * * 9 * * * * * SJ: 10 * * * * * * 5В* 135
в) Переменные Факторы Ci S, S, $4 S. S, s, i S. 1 s о । S,o 1 +* +* 2 +* 3 +* +* 4 +* +* 5 +* +* 6 +* +* 7 +* +* 8 +* +* 9 +* +* 10 +* + * г) Каждая значительная факторная нагрузка обозначается звездоч- кой (*). Алгебраические знаки указываются только тогда, когда они строго определяются данным факторным методом. Соответству- ющие созвездия иллюстрируются на примере 10 переменных. 136
а) Многофакторный метод Тэрстоуна с простой структурой. Накладывающиеся друг на друга групповые и специфические факторы со всеми возможными комбинациями алгебраических знаков. б) Метод главных осей Хотеллинга и Келли. Столько общих факто- ров, сколько переменных. Каждый фактор характеризуется нерегуляр- ным размещением алгебраических знаков. в) Метод Спирмэна. Один общий фактор и специфичные факторы. Все нагрузки положительные (отрицательную пару факторных нагру- зок можно получить путем изменения знаков у любой переменной). г) Двухфакторный метод Холзингера. Общий фактор и ненаклады- вающиеся групповые и специфичные факторы. Созвездие нагрузок групповых фактоРов создает картину «пустых ступеней». Алгебраи- ческие знаки как в методе Спирмэна. д) Метод биполярных факторов Барта. Общие факторы с харак- терной системой алгебраических знаков и специфичные факторы. В приведенных таблицах общие факторы обозначены буквой С, специфичные — буквой S. Необходимо отметить, что некоторые со- звездия показаны лишь в качестве примера. К ним относятся те, для которых возможны различные варианты, соответствующие действитель- ным корреляционным матрицам, например картина размещения на- кладывающихся групповых факторов у отдельных переменных при многофакторном методе (табл. 7.4, а) может быть различной в зависи- мости от конкретных условий. То же можно сказать и о двухфакторном и биполярном методах (табл. 7. 4, г и д). В первом из них могут быть различные количества не накладывающихся групповых факторов, а во втором — биполярных «общих» факторов. Фиксированные схемы для определенного числа переменных дают методы Хотеллинга и Спир- мэна (табл. 7. 4, б и в). Исследователь, использующий факторный анализ для практического решения конкретной задачи, должен осуществлять выбор самого под- ходящего метода. Во многих случаях такой выбор нетруден, так как по соображениям, изложенным выше, наиболее широкое применение в психологии имеет центроидный метод. Целесообразно, однако, кратко обсудить главные критерии такого выбора. Поскольку, как уже отме- чалось, решения, полученные с помощью разных концепций вычисли- тельной процедуры, могут в значительной степени преобразовываться друг в друга (например, путем вращения), психолог при выборе дол- жен руководствоваться прежде всего не математическими соображения- ми. Представляется, что могут существовать два таких критерия. Первый из них, наиболее важный,—это вид созвездия, который не- посредственно дает данный метод без вращения. Второй, скорее вспомо- гательный критерий, — это трудность вычислительной процедуры, которая иногда имеет чисто практическое значение. Рассмотрим подробнее первый критерий. Было бы хорошо, если бы существовал метод, дающий созвездие факторных нагрузок, годное при всех условиях для психологической интерпретации. Это созвез- дие имело бы максимальную полезность и наибольший научный смысл. По мнению большинства специалистов, ни один метод не дает таких 137
реаультатов, которые без вращения могли бы рассматриваться в ка- честве окончательных и эффективных, т. е. вскрывающих сущность яв- ления. Правда, как уже указывалось, Барт склонен считать, что двух- факторный и биполярный методы близки к такому идеалу. Задача факторного анализа состоит прежде всего в определении существенных реально существующих в природе факторов. Различные методы дают определенные отличающиеся друг от друга созвездия фак- торов, результаты которых непосредственно несопоставимы. Инте- ресно, что накопленный опыт показывает, что вращение для получения простой структуры дает системы факторов, которые в определенной степени постоянны и повторяются в различных условиях. С другой сто- роны, можно предполагать, что какие-либо реальные, основные влия- ния, существующие в природе, могут проявляться по-разному. Иногда они могут складываться, в других случаях могут погашать друг друга. Иногда они могут влиять на большее, иногда на меньшее число пере- менных. С этой точки зрения наилучшим будет максимально гибкое созвездие, которое благодаря этому было бы в состоянии учесть раз- личные структуры, реально существующие в собранной совокупности экспериментальных данных. По мнению Кеттелла, этим условиям в наибольшей степени соответствует метод, использующей вращение— многофакторный метод, учитывающий взаимосвязанные общие фак- торы со всевозможными комбинациями алгебраических знаков. В то же время большие сомнения вызывают методы, приводящие к определенным конфигурациям факторных нагрузок, даже если они определены строго математически или их легко использовать. На- пример, методы, дающие созвездия с разграниченными ненакла- дывающимися групповыми факторами. Трудно это согласовать со всем тем, что нам известно о взаимосвязи различных влияний психологи- ческого или социального характера. Такие методы не дают также повто- ряемых наборов факторов, т. е. одинаковых факторных систем для раз- личных матриц и экспериментов. Это, естественно, не означает, что такие процедуры совершенно непригодны. Их можно с успехом ис- пользовать в качестве средств, описывающих и классифицирующих тесты, содержащиеся в определенной матрице. Второй критерий имеет скорее вспомогательное значение. С учетом сложности необходимых расчетов, можно приблизительно ранжировать описанные выше методы следующим образом: наиболее быстросходя- щимся является двухфакторный метод, затем идет центроидный, метод главных осей и метод наибольшего правдоподобия. Понятно,что быс- трое развитие все более совершенных ЭВМ будет вносить большие из- менения в эту классификацию. Существуют еще и другие свойства различных методов определения факторных нагрузок, которые могут влиять на выбор, осуществляемый исследователем в различных усло- виях. Иногда этот выбор может зависеть от точности расчетов, в других случаях — лишь от приближенной схемы отыскиваемой структуры. Однако для общей цели определения основных факторов в таких облас- тях, как психология или социология, наиболее подходящим являет- ся центроидный метод и его основные варианты.
Глава восьмая РАЗЛИЧНЫЕ ТЕХНИКИ ПРОВЕДЕНИЯ ФАКТОРНОГО ЭКСПЕРИМЕНТА 1. ПРОБЛЕМА ТОЖДЕСТВА ФАКТОРОВ Выше была предпринята попытка описать основные этапы проце- дуры факторного анализа, последовательность которых в самой общей форме такова: выделение факторов на основе анализа совокупности корреляций, вращение осей координат, интерпретация природы фак- торов. Были рассмотрены также некоторые детали центроидного метода, сделан краткий обзор других методов определения факторов и про- ведено сравнение основных созвездий факторных нагрузок, выделенных этими методами. Помимо рассмотренных выше в факторном анализе есть еще ряд проблем, имеющих существенное значение. Рамки работы не позволяют рассмотреть их все, тем более мы не в состоянии дать их глубокий анализ. Однако ознакомление читателя, пусть поверхностное, но со всем кругом проблем с учетом их современного уровня развития требует рассмотрения еще некоторых вопросов. Читателю, который пожелает глубже разобраться в проблемах факторного анализа, это поможет ориентироваться при изучении конкретных вопросов. Один из них от- носится к реальности факторов, определяемых аналитическими метода- ми. Выражают ли эти статистические факторы какие-либо реальные яв- ления, существующие в природе? Если да, то в какой степени? Полный ответ на этот вопрос дать очень трудно. Достаточно указать, что он является предметом оживленной дискуссии. Здесь мы рассмотрим лишь некоторые стороны этой проблемы. 139
При обсуждении процесса вращения упоминалась простая струк- тура как критерий реальности факторов. В основе концепции простой структуры лежат в принципе два предположения. Первое из них формулируется по-разному и сводится к тому, что весьма маловероятно, чтобы каждый психологический фактор одинако- во сильно влиял на структуру всех индивидуальных особенностей. Представляется, что по существу речь идет о влиянии определенного фактора на поведение конкретного человека в конкретных условиях. Например, если словесный фактор имеет решающее значение для всех заданий, требующих легкости оперирования словами, то для других заданий, например конструкционных или расчетных, его влияние будет весьма незначительным. В этом смысле говорят о независимости факторов. Второе предположение носит методологический характер: прини- мается, что из ряда гипотез, одинаково хорошо соответствующих дан- ным фактам, нужно выбрать самую простую, требующую минимально- го количества вспомогательных гипотез. В этом случае такой гипотезой о структуре факторов будет «простая структура», дающая самое про- стое объяснение корреляционной матрицы. Однако речь идет не только об этом. Мало определить, какие фак- торы дают наиболее простое объяснение совокупности корреляций, а нужно выяснить, какие факторы лучше всего объясняют корреляции во многих матрицах, полученных в различных экспериментальных исследованиях. В общей форме это можно выразить с помощью такого утверждения: доказательством реальности факторов будет их одинако- вый вид во многих различных исследованиях и анализах, не использу- ющих методы корреляции, а опирающихся на обычный эксперимент или наблюдение. В специальной литературе можно найти примеры та- кого подтверждения результатов факторного анализа с помощью других методов как в психологии, так и в физиологии. Однако, поскольку эти критерии реальности факторов выходят за рамки самого факторного анализа, мы не будем обсуждать их подробно. Вместо этого мы кратко рассмотрим возможности исследования тождества факторов в рамках самого анализа, т. е. при помощи методов корреляции. При сравнении факторов, трактующих психологические явления и полученных из разных матриц корреляций, как правило, берутся кор- реляции, которые вычислены на одном и том же множестве переменных или тестов, реализованных в различных группах обследуемых людей. Можно, однако, сравнить также и различные серии тестов, использо- ванных для различных групп и определенно включающих меньшие сово- купности одинаковых пли эквивалентных тестов. При вращении ре- зультатов исчисленных факторных матриц не следует, очевидно, учиты- вать опыт предшествующего анализа, так как иногда может создаться фиктивное подобие факторов путем совершенно непроизвольной под- гонки способа вращения к принятой гипотезе. Поэтому существует принцип слепого вращения, согласно которому переменные как бы та- суются и обозначаются номерами, не известными человеку, осуществля- ющему вращение до положения простой структуры. При соблюдении 140
этого принципа можно предположить, что многократное получение одних и тех же факторов в частично различающихся сериях тестов, в группах, отличающихся возрастом, образованием, полом, распреде- лением результатов нт. п., является веским доказательством сущест- вования этих функциональных единиц, влияние которых действитель- но существует. Новейшая фаза развития факторного анализа характе- ризуется поиском критерия тождества факторов в несколько другом, более широком смысле. Речь идет о сравнении факторных структур, полученных при помощи тех же вычислительных процедур, о которых мы говорили выше (например, таких, как центроидный метод, метод главных осей и т. д.), но использованных применительно к другим кон- цепциям самого эксперимента, который обеспечивает данные о кор- реляциях. Эти различные «техники» факторного анализа подробнее будут рас- смотрены ниже. 2. ТЕХНИКИ R И Q До сих пор мы говорили о проблемах факторного анализа примени- тельно к совокупности корреляций в определенной группе переменных, используя в основном примеры из психологии, где переменные, как пра- вило, имеют характер тестов, которым подвергается группа лиц. Очевидно, что в более широком смысле речь может идти о всевозмож- ных средствах исследования или получения данных наблюдения — психологических, социологических, физиологических и т. д. В данный момент для нас существенно, чтобы общая процедура была следующей. С помощью некоторого относительно небольшого количества тестов изучается по возможности большая группа лиц и затем подбираются коррелирующие пары переменных (результаты тестов) для получения коэффициентов корреляции. Основой каждой такой корреляции явля- ются одноразовые результаты группы лиц, выполняющих два каких- либо задания. Такой способ определения коэффициентов корреляции, используемых в дальнейшем анализе, называется «техникой Л». Крат- ко ее можно определить следующим образом: в технике R каждый тест коррелирует с другим тестом (т. е. берутся два теста одновре- менно), причем группа лиц подвергается каждому тесту один раз. До настоящего времени наибольшее число работ по факторному анализу (около 95%) применяет технику R. По прошествии по крайней мере 10 лет, в течение которых обобщал- ся опыт в области факторного анализа, было установлено, что существу- ет и другая «техника» определения корреляций. В ее основе лежит воз- можность корреляции между людьми, единовременно прошедшими се- рию тестов. Что это значит? Относительно небольшая группа лиц изу- чается с помощью максимально возможного числа тестов и определя- ются корреляции между людьми, причем одновременно берутся две переменные (в нашем случае два лица). Полученный коэффициент по- казывает, в какой мере два человека одинаково выполняли серию одних и тех же тестов. Этот способ определения корреляций называется «тех- 141
никой ф». Взаимосвязь техники Q и техники R можно проследить с по- мощью таблицы оценок. Если в ее верхней строке перечислены тес- ты, а в первом столбце лица, проходящие данную серию тестов (табл. 8.1), то оказывается, что при использовании техники R каждый раз сопоставляются два столбца, а при использовании техники Q—две строки. Таблица 8.1 Две стро- ки, кор- релирую- щие в технике Q ца, корре- лирующих в технике R Если рассчитать все корреляции между элементами строк этой таб- лицы, то получим матрицу корреляций между людьми, а не тестами. Чтобы определить постоянные (надежные) коэффициенты этих корреля- ций, нужна, видимо, относительно большая серия тестов, в то время как число людей может быть относительно небольшим. (В технике R, наоборот, большая группа людей подвергалась относительно не- большому количеству тестов.) Как понимать корреляцию между людь- ми? Представим себе большую серию самых разных вариантов словес- ных, расчетных, механических и других тестов способностей. Если ли- цо А выполняет эти тесты так же, какВ, т. е. одни и те же тесты хорошо, а другие плохо, то между А и В существует высокая корреляция при данной серии тестов. В этом случае лица А и В будут очень походить друг на друга в отношении структуры способности и степени, в которой серия тестов исчерпывает эту структуру. Если А плохо выполнил те тесты, которые В выполнил хорошо, и наоборот, то между А и В будет отрицательная корреляция, свидетельствующая о том, что струк- туры их способностей будут противоположны. Чтобы применить фак- торный анализ к таким корреляциям, нужно, видимо, располагать ко- личеством коэффициентов корреляции, превышающим 1, что требует изучения группы лиц, состоящей, например, из 10—12 человек (по- добно тому, как в технике R нужна серия, состоящая из некоторого ми- нимального количества тестов). Возникает вопрос: что дает фактор- ный анализ материала, собранного с помощью техники Q? Оказывается, что в корреляционной матрице, соответствующей этой технике (точно так же, как в матрицах тестов), существуют связки корреляций; каж- дая такая связка — это группа лиц, похожих друг на друга и непохо- 142
>ких на другую группу, образующую другую связку. Представляется, что техника Q годится для определения типичных единиц лишь в той степени, какая соответствует применяющейся серии тестов. Если, одна- ко, представить себе, что удалось собрать полную серию тестов индиви- дуальных способностей, то можно предположить, что в матрице, соответ- ствующей технике Q, лицо, характеризующееся наибольшей средней корреляцией со всеми другими людьми в связке, является типичным, с учетом ряда свойств структуры индивидуальных особенностей. Факторы, получаемые с помощью техники Q, являются, по мнению большинства авторов, теми же, что и в технике А’. При этом нужно учесть ряд специальных модификаций, касающихся в первую очередь общего фактора. Об этом мы будем еще говорить. Если, например, с помощью техники 7? определяется фактор механических способностей, то техника Q дает фактор «лиц со способностями к механике». По су- ществу, это одно и то же и разница лишь в том, что с помощью техники А удается выделить тесты, сильнее загруженные данным фактором, тогда как с помощью техники ф сказанное относится к лицам. Много- кратно отмечалось, что факторные структуры, полученные одними и теми же способами для одних и тех же групп людей и тестов, харак- теризуются большим сходством. 3. ТЕХНИКИ РИО Совершенно иначе строятся факторные эксперименты, в которых применяются «техника Р» и «техника О», предложенные Кеттеллом в 1946 г. В отличие от техник А? и ф, оперирующих группами лиц, в техниках Р и О факторный анализ применяется к отдельным людям. Рассмотрим вначале технику Р. Здесь используется совершенно другая структура эксперимента: применительно к одному человеку ис- следования осуществляются при помощи не очень большого числа тестов, которые повторяются через определенные интервалы времени до тех пор, пока мы не получим «серию случаев», между которыми могут существовать корреляции. Обычно определяются корреляции между каждой парой таких «переменных», что дает коэффициенты, по- казывающие, в какой мере два теста, ежедневно выполняемые данным лицом в течение месяца, характеризуются одинаковым колебанием ре- зультатов. Ясно, что переменные, одинаково изменяющиеся во време- ни (в разных случаях и обстоятельствах), образуют связки в матрице корреляций. В этом случае с помощью факторного анализа можно опре- делить основные влияния, лежащие в основе этих колебаний и измене- ний и характерные для индивидуальных особенностей человека. Тех- ника Р создает, кроме того, интересную возможность получения кон- тролируемых изменений в процессе смены обстоятельств. Проводя по- следовательные исследования, можно изменять ситуации, вводя в ана- лиз новые элементы, влияющие на колебания результатов. Однако тех- ника Р может применяться и без этого. В принципе она не требует так- же и того, чтобы исследования проводились в каком-то определенном постоянном ритме (ежедневно, еженедельно). Произвольной может 143
быть и длина интервалов, разделяющих отдельные случаи или обсто- ятельства. Все это зависит от вида и цели эксперимента. Ясно, что там, где речь идет о влиянии психологических факторов, связанном со вре- менем их действия (утомление, обучение и т. п.), условия должны устанавливаться и сохраняться в течение всего исследования. Техника Р открывает для теоретической психологии широкие возможности, в настоящее время еще не используемые на практике. Во-первых, она позволяет изучать индивидуальные, неповторимые свойства людей, в противоположность технике R, которая оперирует лишь различными комбинациями общих черт. Во-вторых, опа позволяет использовать факторные методы для исследования психосоматических связей, по- скольку в матрицу можно включить психологические и физиологи- ческие наблюдения, относящиеся к одному и тому же организму. Остается еще охарактеризовать технику О. Она аналогична тех- нике Р с той точки зрения, что здесь мы также сталкиваемся с индиви- дуальной «факторизацией» личности. В то же время ее отличие состоит в том, что если в технике Р коррелируют тесты, выполняемые чело- веком в течение довольно большой серии случаев, то здесь коррелируют сами эти случаи. Что это значит? Используется большая серия, состо- ящая, например, из 20—25 тестов. С их помощью обследуется один че- ловек в течение, скажем, 100 дней. Каждый день мы получаем какой- либо набор оценок из всех тестов серии. Это и будет «переменной», подверженной колебаниям в рамках группы тестов. Поэтому здесь коррелируют не тесты, а дни. Сказанное можно проиллюстрировать на примере матрицы оценок, строки которой содержат оценки данного теста в отдельные дни, а столб- цы — оценки всех тестов серии для одного дня (табл. 8.2). Столбцы показывают результаты, характерные для данного дня (случая). Под- коррели- рующих при технике О 144
бирая коррелирующие случаи, получаем корреляционную матрицу, в которой некоторые группы случаев могут объединяться в связки и да- вать разные факторы. Фактор будет здесь представлен определенным набором результатов серии тестов, который будет относительно посто- янным среди таких наборов, изменяющихся изо дня в день. Приме- нять этот метод довольно трудно, так как он требует исследования боль- шого числа тестов при одном «случае». При этом фактор определяется с помощью набора результатов, связанного с таким случаем, менее точно, чем при технике Р. Как техника О, так и техника Р требуют, очевидно, предположения, что отдельные случаи существенно отлича- ются с какой-то точки зрения. Иначе будут отсутствовать изменения, которые бы коррелировали друг с другом. И здесь, так же как и в технике Р, можно формировать отдельные случаи, вводя в анализ ка- кие-либо ситуации с возмущением. 4. СРАВНЕНИЕ ТЕХНИК R, Q, Р И О Между техниками R и Q, а также Р и О существуют особые вза- имосвязи. Если обратиться к матрице оценок (табл. 8.1), используемой и при расчете коэффициентов корреляции, то, как уже отмечалось, это означает, что в случае техники R коррелируют ее столбцы, т. е. резуль- тг .ы каждых двух тестов в группе лиц. Наоборот, в случае применения техники Q коррелируют люди, выполняющие совокупность тестов. С учетом этого многие авторы называют технику Q обратным по отно- шению к технике R факторным анализом. Барт считает, что правиль- нее было бы называть ее транспонированной, так как матрица оце- нок, лежащая в основе корреляций, будет при технике Q транспониро- ванной к матрице, использованной в технике R. Табл. 8.2 показывает, что техника О является транспонирован- ной к технике Р. В технике Р каждый раз коррелируют два теста, вы- -полняемые в течение «совокупности случаев», тогда как в технике О коррелируют каждый раз два таких случая, охватывающих совокуп- ность тестов. Более того, как уже отмечалось, техники R и Q основыва- ются на совокупностях лиц, тогда как Р и О относятся к отдельным ли- цам. Наконец, аналогами различных тестов в техниках R и Q являются различные «случаи» в техниках Р и О. Как уже отмечалось, техники R и Q, использованные для анализа одного и того же материала, дают в принципе одинаковые результаты. То же можно сказать и о па ре Р и О. Однако могут происходить некоторые заслуживающие внимания отклонения. Не вдаваясь в подробности, рассмотрим их в сжатом виде. При разборе техник R и Q возникает интересный вопрос: каким будет первый общий фактор, определенный с помощью техники Q. Харак- тер этого фактора будет несколько иным по сравнению с первым факто- ром, рассчитанным с помощью техники R. Поскольку при технике Q коррелируют люди, а не тесты, то первый выделенный из корреляцион- ной матрицы фактор, с которым у большинства людей высокая корреляция, будет представлять собой что-то вроде «качественного» 145
фактора, соответствующего чему-то наиболее распространенному и ти- пичному для группы обследуемых людей (очевидно, в рамках исполь- зуемой серии тестов или наблюдений). Такого типа фактор не дает, как правило, новой информации, представляющей интерес для исследо- вателя, который уже знает, что перед ним материал о людях, и который, за исключением особых случаев, не стремится к уточнению какого-то «качественного» образа. Только после выделения этого фактора мож- но перейти к следующим факторам, связанным с индивидуальными различиями, что представляет для исследователя большой интерес. Точно так же в технике О в качестве первого фактора, выступающего среди набора «случаев», получаем какой-то типичный образ резуль- татов, нечто, что можно было бы в приближении определить как «лицо, такое, как оно есть в типичной ситуации». В этом случае также инте- ресны лишь следующие факторы. Вернемся к технике 7? и Q. Каковы главные различия между ними? Помимо случая первых общих факторов, о которых говорилось выше, большое значение имеет еще проблема вращения к простой структуре. Вспомним, что концепция эта основывается на предположении, что не- которые тесты могут иметь нулевые нагрузки определенных факторов. В отношении тестов такое предположение полностью оправдано, так как легко себе представить конкретное задание, не требующее каких- то определенных навыков. Напротив, трудно представить себе людей, у которых совершенно отсутствуют факторы, которыми наделены дру- гие люди. Лишь в незначительном количестве работ, выполненных с помощью техники Q, удалось получить простую структуру, причем эти работы использовали в значительной степени неоднородные совокуп- ности. Если представить себе группу, составленную, например, из артистов и людей, не имеющих никакого отношения к этому искусству, то становится понятным, что фактор артистических способностей дей- ствительно может отсутствовать у многих обследуемых лиц. Представ- ляется, что целесообразно придерживаться правила, рекомендующе- го использовать вращение для получения простой структуры только в тех работах, выполненных техникой Q, которые основываются на неоднородных совокупностях. Рассмотрим еще одну проблему. При применении техники вы- двигалось правильное статистическое требование, в соответствии с ко- торым выборка из общей совокупности должна быть существенной при- менительно к обследуемым людям. Прежде всего она должна быть до- статочно большой, чтобы выводы можно было распространить на всю совокупность с минимальной ошибкой. Поэтому нужно использовать в анализе совокупности, состоящие из сотен людей. С учетом этого в случае техники Q напрашивается предположение, что нужно распола- гать соответственно существенной выборкой тестов, если вообще можно говорить о совокупности тестов. Речь идет о том, чтобы используемая серия тестов максимально всесторонне охватывала индивидуальные особенности человека. В технике Q коррелируют люди, и на основе высокой корреляции используемых тестов делается вывод о сходстве людей. Если, однако, тесты или другие задания касаются лишь не- 14э
которых частей индивидуальных особенностей, то два человека,характе- ризующиеся высокой корреляцией, могут быть совершенно непохожими во всех других отношениях. Напрашивается вывод, что избежать по- иска вслепую и правильно применять технику Q (также, как и Р) можно было бы в тех случаях, когда исследователь располагает тестами (в ши- роком смысле этого слова), охватывающими какие-либо существенные факторы индивидуальных особенностей. Необходимо, однако, помнить, что определить такие факторы можно лишь с помощью техники Р. Есть еще различие между техниками Р и Q. Так, например, пол- ностью отличаются друг от друга окончательные ситуации, в которых исследователь приходит к результатам анализа. Применительно к технике Р устанавливается, какие тесты имеют высокие нагрузки дан- ных факторов. Эти тесты могут, очевидно, сохраняться и использо- ваться в личных экспериментах и в различных выборках обследуе- мых людей для определения природы данного фактора. Прямо противо- положная ситуация в технике Q. Ведь здесь анализ позволяет выделить людей, характеризующихся высокой нагрузкой того или иного факто- ра, людей, оказывающихся в различных изменяющихся ситуациях в результате существования различных влияний. Ни в коем случае нельзя людей рассматривать как тесты. Здесь исследователь натал- кивается на большие трудности при интерпретации факторов. Как на основе характера оценок из всей серии тестов, полученных данным лицом в анализе с помощью техники Q, так и с учетом дальнейшего изучения этого человека, трудно получить ясное представление об ин- тересующем нас факторе. Профиль оценок, полученных в серии тестов, покажет, например, что результаты, достигнутые изучаемым лицом в пяти тестах, ниже средних, а результаты в других пяти тестах — выше средних. На основании этого трудно делать выводы о природе фактора, которым загружено данное лицо. В случае техники Р. зада- ча выглядит проще. На основе двух тестов, характеризующихся боль- шими нагрузками одного и того же фактора, можно как-то судить о его природе, учитывая общие свойства этих тестов. Например, если одним из таких тестов будет тест пропущенных слов, а другим — тест противопоставлений, то с большой вероятностью можно утверждать, что речь идет о словесном факторе. При выборе одной из рассмотренных техник нужно учитывать са- мые разные обстоятельства. Решающее значение имеет, видимо, цель работы и тип эксперимента, в наибольшей степени соответствующий ее достижению. Как уже отмечалось, наибольший интерес к технике Q проявляют клинические психологи. Определенную роль при этом выборе играют также такие обстоятельства, как, например, число лю- дей, которых удается собрать для проведения исследования. При боль- шом числе людей всегда лучше использовать технику Р, если она к тому же соответствует и другим требованиям. Если нельзя собрать больше 10—20 человек, нужно использовать технику Q и большие се- рии тестов. Необходимо учитывать, что, вопреки существующим взгля- дам, эта техника требует больших затрат времени и труда. Использо- вание больших серий тестов даже для небольших групп людей требу- 147
ет больше ’времени, чем исследование большой группы с помощью меньшего числа тестов. Учитывая то, что изучение больших групп осу- ществляется чаще всего коллективно, нужно говорить о том, что тех- ника R является более экономичной. Необходимо соблюдать максимальную осторожность при обобщении результатов, достигнутых с помощью техники Q или /?, так как пер- вая опирается на небольшую группу людей, а вторая — лишь на одно- го человека. Правильное объяснение таких результатов возможно толь- ко путем сравнения с данными, опирающимися на большие группы лиц, или с результатами целых серий исследований при помощи техники Q или R. В общем техника R определяет как бы некоторые границы, с учетом которых остальные техники могут быть правильно ранжиро- ваны. В этом заключается ее основное значение, которое выходит за рамки чисто исторического. Можно предположить, что в процессе дальнейшего развития факторного анализа техника R сохранит свое доминирующее значение за исключением может быть весьма специфич- ных случаев. В заключение рассмотрим еще два вида техники, которые логи- чески возможны, хотя, судя по доступным в настоящий момент материа- лам, еще не нашли широкого применения. Речь идет о техниках S и Т, причем последняя является транспонированным случаем первой. В технике S сопоставляются результаты двух лиц при выполнении одного теста в течение целой серии случаев. В технике Т соспоставля- ются два случая выполнения одного теста всей группой лиц. Рассмотрим кратко технику S. Представляется, что она имеет осо- бое значение для социальной психологии, поскольку она может помочь при измерении сходства реакций двух человек на идентичные задания в течение целой серии случаев. Исследование таких групп, состоящих из двух человек, как, например, близнецы, мужья и жены, работники и их подчиненные и т. п., даст материал, с помощью которого можно будет изучить, насколько одинаково или неодинаково выполняли два человека определенные задания в данной серии случаев. Общие факторы, определяемые с помощью этой техники, будут относиться к группам или классам людей, которые одинаково реагируют не только в одном, а целом ряде случаев. Отсюда вытекает, что эта техника может иметь наибольшее значение для эмпирического определения группы людей с учетом их реакции на задания или ситуации. Именно этим социальным аспектом объясняется обозначение техники буквой S (англ, social). Техника Т представляет собой попросту анализ на факторы коэф- фициентов надежности, определяемых для одного и того же теста и для тех же самых людей в различных обстоятельствах. Много людей выпол- няет один и тот же тест два раза. Возникает вопрос: будут ли результа- ты первого испытания теми же, что и второго испытания, т. е. будет ли группа людей, плохо выполнивших тест первый раз, той же, что и группа людей, плохо выполнивших тест во второй раз? Что будут пред- ставлять собой факторы? Очевидно, они будут какими-то группами слу- чаев-, обладающими каким-либо основным сходством в смысле влияния, 148
оказываемого ими на результаты лиц, выполняющих тест. Теорети- чески можно, следовательно, с помощью такой техники определить, ка- кие элементы в данной ситуации влияют на реакции людей и сколько этих элементов. Взаимосвязь техник S и Т можно также определить с помощью таблицы оценок (табл. 8.3). Ее строки включают оценки отдельных люден, полученные в данном тесте в процессе смены обсто- ятельств. Столбцы включают результаты для всей группы людей в от- дельных обстоятельствах. Используемый тест, задание или проверка всегда одни и те же, а поэтому в таблице не указываются. В случае техники S сопоставляются строки, в случае техники Т — столбцы. коррелирую- щих в тех- нике Т В качестве дополнения к этому краткому изложению различных техник факторного анализа приведем в заключение общую схему всей системы, позволяющую сопоставить описанные процедуры. Прежде всего, мы имеем три основные экспериментальные модели, каждая из которых включает две техники. Всего таких техник шесть. Каждая основная схема включает три главных элемента: «изучаемое лицо», «тест» (задание) и «случай». В каждой такой схеме один из эле- ментов является постоянным, а два остальных — переменными. Таким образом: а) первая схема с техниками и Q относится к одному случаю (слу- чай — постоянная величина); б) вторая схема с техниками О и Р относится к одному человеку; в) третья схема с техниками S и Т относится к одному тесту. Можно найти и другие способы учета зависимостей между шестью техниками факторного анализа. Техники Р и S используют серию слу- чаев, техники О и Р — серию тестов, техники R и Т — серию лиц. В техниках Р и R коррелируют тесты, О и Т — случаи, Q и S — люди. С проблемой техник R, Q, Р, О, S, и Т связано еще много важных вопросов, сводящихся, прежде всего, к шкалированию оценок (эти оценки могут быть необработанными или выраженными в единицах стандартного отклонения). Подробное изложение этих проблем можно найти в специальной литературе. 149
Глава девятая ЗАВИСИМЫЕ ФАКТОРЫ И ФАКТОРЫ ВЫСШИХ ПОРЯДКОВ 1. КОСОЕ ВРАЩЕНИЕ До сих пор мы оперировали понятием ортогональных факторов, представленных взаимно перпендикулярными осями координат без- относительно к размерности системы. Связанная с этим зависимость факторов оказывается выгодной с чисто вычислительной точки зрения и рассматривается скорее всего в том смысле, что в некоторых конкрет- ных тестах обнаруживаются факторы, отсутствующие в других за- даниях. Это и имеется в виду, когда речь идет о статистической неза- висимости факторов. Однако факторный анализ не ограничивается концепцией ортого- нальных факторов. В целях дальнейшего изложения нужно немного отступить назад, вернувшись к проблеме вращения осей координат, которая была изучена на примере шести переменных. Описанная про- цедура целиком относилась к случаю перпендикулярного вращения. Это означает, что каждая пара осей системы координат перемещалась при сохранении между ними угла 90°. Необходимо, однако, учитывать, что вращение с использованием реальных экспериментальных данных приводит, как правило, к окончательным решениям, в которых угол между осями не всегда прямой. В большинстве работ, основывающихся на психологических, био- логических или социологических данных, глубокий анализ позволяет обнаружить, что совокупности точек, .образующие гиперплоскости, не являются взаимно перпендикулярными. Отсюда вытекает, что пред- положение перпендикулярности осей системы координат представля- ет собой определенное упрощение, допустимое в одних и недопустимое 150
в других случаях. По мнению Кеттелла, все вращения с использова- нием физических, биологических, психологических или социологи- ческих данных убеждают в том, что истинные факторы, действительно существующие в природе, в той или иной степени коррелируют друг с другом. В этом нет ничего удивительного. Образ мира, существую- щий сегодня, требует учета взаимосвязей и зависимостей всех его эле- ментов. И хотя какой-либо фактор может быть выделен в качестве неза- висимого влияния на определенную зависимую от него группу перемен- ных, сам этот фактор, несомненно, зависит от других факторов. Можно привести много примеров из области психологии, которые иллюстрируют зависимость факторов. Тэрстоун установил корреля- ции между факторами способностей. В исследованиях структуры инди- видуальных особенностей была обнаружена тенденция к положитель- ной корреляции между осями фактора В (общей одаренности) и факто- ра С (эмоционального равновесия). Для более глубокого исследования проблемы зависимых факторов целесообразно еще раз обратиться к вопросу «независимости» факторов. Кеттелл отмечает, что независимость факторов можно понимать двояко. Допустимо говорить, что какое-либо явление независимо в том смысле, что оно может быть независимо выделено из конкретных данных, абст- рагировано, задумано и названо. В этом смысле независимым может быть цвет, форма, вес, хотя в действительности конкретные предметы являются цветными, тяжелыми, легкими, и т. п. Такая абстрактная независимость полностью согласуется с тем, что эти элементы могут влиять друг на друга, представляя собой, например, свойства конкрет- ного живого организма в природе. И хотя такие свойства можно обоз- начать независимыми символами в математических уравнениях, им может быть присуща тенденция к корреляции. Независимость можно понимать и более глубоко, когда к «абстракт- ной» независимости добавляется еще статистическая независимость. Такая независимость сопровождается полным отсутствием корреляции. Если переменные символически представлены как векторы в простран- стве, угол между ними будет точно равен прямому. Кеттелл подчеркива- ет, что концепция ортогональных факторов, возникшая на заре факторного анализа, относится к факторам, независимым во втором смысле. В то же время коррелируемым факторам, существование ко- торых должно было обнаружиться в процессе дальнейших исследова- ний, можно приписать независимости в первом смысле. В соответствии с принятой геометрической символикой, с помощью которой корреляция выражается углом между векторами, представля- ющими переменные, факторы, коррелирующие друг с другом, называ- ются косыми факторами. Это означает попросту, что в этом случае оси координат, представляющие собой факторы, наклонены друг к дру- гу под углом, отличающимся от прямого. При этом угол наклона мо- жет быть как острым, так и тупым, что соответствует положительной и отрицательной корреляции. Соответственно независимые факторы, оси которых строго перпендикулярны, часто называются ортогональ- ными. 151
Значение косых факторов продолжает оставаться предметом дис- куссий среди специалистов по факторному анализу. Большое значение здесь имеет тот факт, что вращение косых факторов значительно осложняет вычисления. Приведем различные аргументы обеих сторон, т. е. сторонников концепций косых и ортогональных факторов. На- пример, Кеттелл, считающий косые факторы неотъемлемым элементом факторного анализа, подчеркивает, что в попытках объяснения и пред- видения явлений в природе необходимо скорее всего следовать приро- де, а не навязывать ей искусственные упрощения. Ограничение анали- за ортогональными факторами часто связано с серьезными ошибками. Поскольку в различных изучаемых группах углы между факторами разные, то в случае использования перпендикулярных осей никогда нельзя получить идентичные системы факторных нагрузок на основе двух любых корреляционных матриц. Поэтому и трудно устанавливать тождество факторов на основе ряда осуществляемых по плану экспе- риментов. Ортогональные факторы имеют определенное значение толь- ко для одной корреляционной матрицы. Отсюда следует, что при необ- ходимости определения одних и тех же факторов в различных экспе- риментах, осуществляемых в разных условиях, нужно использо- вать косые факторы. Бездоказательным является аргумент экономии на вычислениях, выдвигаемый противниками концепций зависимых факторов, поскольку нельзя понимать ее узко как экономию расчетов в случае одной конкретной корреляционной матрицы. Если такую эко- номию понимать более широко, применительно ко всему направлению исследований, то более экономичным окажется использование косых факторов, позволяющпее избежать многих ошибок. У других исследователей те же аргументы облечены в иную форму. Указывается, например, что если факторы, полученные на основе экс- периментальных данных, действительно косые, то это нужно учитывать при интерпретации результатов и всяческих попытках определения природы факторов. Введение в анализ «косой» системы координат поз- воляет отыскивать лучшее соответствие осей и связок векторов, пред- ставляющих переменные, и определять более выразительную простую структуру. Как правило, акцентируется тот факт, что в природе су- ществуют широко распространенные связи всех элементов и явлений, и это нужно учитывать в методах факторного анализа. Для полноты рассмотрим некоторые аргументы сторонников пер- пендикулярных осей. Они подчеркивают, что перпендикулярные оси теоретически соответствуют независимым факторам. Если использу- емые на практике инструменты наблюдений (например, тесты) не настолько независимы как теоретические факторы, то это скорее до- казывает, что независимые инструменты еще не сконструированы. В то же время не доказывается, что факторы действительно зависимы. Это должно служить стимулом для разработки таких инструментов исследования, которые опираются на независимые факторы. Часто выдвигается аргумент, который уже рассматривался выше, что проце- дура, основывающаяся на концепции независимых факторов, гораздо проще с вычислительной и геометрической точек зрения. Здесь пус- 152
каются в ход даже такие вещи, как миллиметровая бумага, на которой можно точно изобразить прямоугольные системы координат. В то же время при изображении косых осей необходимы поправки на неточ- ность. В расчетах не нужно оперировать различными сложными понятиями, связанными с концепцией косых факторов. Наиболее существенным представляется, однако, следующий аргумент: сто- ронники независимых факторов утверждают, что за исключением случаев большой корреляции осей системы координат формулы факторов, полученных с помощью двух возможных методов, существен- но не различаются и могут интерпретироваться одинаково. В тех на- иболее частых случаях, когда корреляция осей незначительна, косое вращение значительно осложняет расчеты и не позволяет выявить различия, имеющие какое-либо практическое значение. Ознакомившись со всеми такими аргументами, мы все же считаем, что по крайней мере в случаях значительной корреляции осей факто- ров нужно использовать метод косого вращения. Существует несколько методов такого вращения. Подробно они рассматриваются в более фундаментальных работах по факторному анализу. Чтобы познакомить читателя хотя бы с самыми общими про- блемами, связанными с косым вращением, рассмотрим един-из наи- более распространенных методов, используя простой пример, позаимст- вованный из литературы. Для начала сделаем пару вводных замечаний. В случае перпендикулярного вращения, подробно рассмотренного с помощью примера шести переменных, самым существенным было то, что угол между осями системы координат в процессе вращения всегда был прямым. Поэтому факторы всегда оставались «независимыми», как и перед вращением. При косом вращении каждая ось вращается отдельно, при этом можно не заботиться о том, чтобы угол между нею и другими осями оставался прямым. Именно поэтому косое вращение дает большую свободу при выборе положения каждой оси, благодаря чему можно получить большое число нулевых факторных нагрузок. С помощью косого вращения легче достичь простой структуры. Конкретный метод косого вращения, который мы попытаемся кратко описать, представляет собой один из многих используемых на практике методов. Область его применения для различных видов экспериментов довольно широка. Этот метод называется лучевым, или радиальным. При рассмотрении этого метода будут введены некоторые новые понятия и термины, которые не были нужны при перпенди- кулярном вращении. Необходимо подчеркнуть, что способы изложения различных методов факторного анализа разными авторами могут существенно отличаться друг от друга. При этом имеется в виду не толь- ко используемая символика, но и способы описания различных поня- тий и особенностей применяемой процедуры. В этих условиях дать по- нятное и однозначное изложение какого-либо более или менее сложно- го метода нелегко. Попытаемся как можно более последовательно поль- зоваться символикой, которая была введена нами при описании перпен- дикулярного вращения. При изложении метода воспользуемся реальным примером, рассмот- 153
ренным Дж. П. Гилфордом (Psychometric methods, New York 1954. Me Graw — Hi 11).В основе примера лежали 8 тестов, составляющих уже давно известную серию «Army Alpha», использованную в свое время в американской армии. С помощью этих тестов обследовалась группа из 108 студентов высшей технической школы. После осущест- вления факторного анализа уже известным нам центроидным методом была получена факторная матрица Vo (табл. 9.1). С помощью этой мат- рицы попытаемся проиллюстрировать процедуру косого вращения ради- альным методом, включающую следующие последовательные операции: 1. Матрица Уо включает три центроидных фактора Clt С2 и С3. Это означает, что перед нами трехмерный случай. Как и в случае перпенди- кулярного вращения, начнем с изображения совокупностей точек, со- ответствующих концам векторов, принимая во внимание каждый раз одновременно по две оси. Координаты отдельных точек, как и ранее, получаем из факторной матрицы. На рис. 9.1 изображены две такие совокупности в плоскостях С^ОС^ и СгОС3, где О — начало координат. Центроидные оси Сх и С2 и Cj и С3 перпендикулярны друг другу. Тща- тельно изучим конфигурацию точек для определения направления и масштаба вращения. 2. Через совокупности точек проводим линии, проходящие через начало координат. Они должны попадать в максимально возможное число точек или проходить в непосредственной близости к ним. Эти ли- нии, обозначенные па рис. 9.1, а через ах и 0Х, представляют собой уже известные нам «гиперплоскости». Указанным выше условиям в наи- большей степени соответствует линия 0г, так как точки тестов 1, 6 и 2 Рис. 9.1. Графики конфигурации точек 8 тестов перед косым вращением лежат прямо на ней. Необхо- димо отметить, что направле- ние, в котором размещаются эти точки, совпадает с радиу- сом окружности с центром в точке О. Поэтому такая груп- пировка точек называется ра- диальной полосой, откуда и происходит название метода. Линия ат в меньшей мере со- ответствует приведенным ус- ловиям, так как точки не об- разуют здесь радиальной по- лосы. Однако здесь она очень близко подходит к точкам 5 и 8. Обе линии ах и 0Ъ лежа- щие в плоскости СГОС2, явля- ются в принципе следами ги- перплоскостей. Если пред- ставить себе еще третье изме- рение, то наши точки могут выходить из плоскости СгОС2, 154
либо находиться выше или ниже ее. То, что мы видим на этой плоско- сти, представляет собой лишь следы этих точек, точно так же, как линии ах и р( являются следами гиперплоскостей. Определив поло- жение гиперплоскостей, вычерчиваем из точки О перпендикулярные к ним линии. Эти линии, обозначенные +С2 и являются нор- малями к гиперплоскостям (нормаль к плоскости — это линия, перпен- дикулярная к ней). В случае радиального метода нормали к гиперпло- скостям служат новыми осями координат. Поэтому, как легко ви- деть, тесты, лежащие в гиперплоскости, будут иметь нулевые проек- ции на такую ось отсчета, тогда как тесты, наиболее отдаленные от гиперплоскостей, будут иметь после вращения наибольшие нагрузки фактора, представленного нормалью. На рисунке нормаль к гиперплоскости обозначена +С2, так как она расположена ближе коси С2, чем кСх. Напротив, нормаль к гипер- плоскости обозначена +С'. Направление нормали строго совпадает с направлением, соответствующим местонахождению остальных точек. Определив новые положения осей Сх и С2, перейдем к оси С3. Вос- пользуемся рисунком 9.1, б, на котором изображена конфигурация точек в плоскости С2ОСЯ. Здесь целесообразно провести гиперплоскость поблизости от точек 2, 5 и 8. Линия, представляющая собой след этой гиперплоскости, обозначена -yj. Перпендикулярная к ней линия (нормаль к гиперплоскости) С3, дающая положительные проекции других тестов, должна проходить в направлении вниз направо. Те- перь, когда определены все три новые положения трех осей, можно при- ступить к вращению. Косое вращение осуществляется несколько ина- че, чем перпендикулярное, а именно одновременно перемещаются все те оси, для которых были определены гиперплоскости. В нашем слу- чае первая итерация вращения еще не дает окончательного результа- та, но зато позволяет приблизиться к нему. 3. Следующим шагом, как и в случае перпендикулярного вращения, является построение матрицы трансформации. Умножение исходной факторной матрицы Ко на матрицу трансформации дает первую матри- цу повернутых факторов 14. Как видим, основная процедура аналогич- на случаю перпендикулярного вращения. Отличие заключается в спо- собе получения матрицы трансформации X. Процесс построения этой матрицы начинается с определения направляющих чисел каждой новой оси или, в нашем случае, нормали к соответствующей гиперплоскости. Направляющие числа — это координаты, определяющие положение новой оси относительно исходной центроидной оси. Эти координаты определяются таким образом, что выбирается какая-либо точка на новой передвинутой осп и из этой точки восставляются перпендикуляры на пентроидные оси, представляющие в этом случае систему отсчета для вращения. На практике прежде всего проводятся линии, параллель- ные центроидным осям (на рисунке это пунктирные линии). Расстоя- ние каждой такой линии от центроидной оси, которой она параллель- на, равно единице. Затем новые оси (нормали к гиперплоскостям) удли- няются до пересечения их с пунктирными линиями. Координаты этих точек пересечения дадут искомые направляющие числа. На рис. 9.1, а 155
показаны точки пересечения новой оси С2 с линией, параллельной центрондной оси Съ и точка пересечения новой оси С{ с линией, параллельной центрондной осн С2, а на рис. 9.1,6 отмечена точка пе- ресечения новой оси Сз, с линией, параллельной оси Сх. Теперь каждая новая ось может быть определена с помощью уравнения, включающего направляющие числа, взятые из рисунков. Эти уравнения имеют сле- дующий вид: С[ = 1,00 Q — 1,76 С2; С2 = 0,67 Сг + 1,00 С2; Сз = 0,60 Сх — 1,00 С3. 4. Направляющие числа записываются в матрицу 5г (табл. 9.1). Нулевые элементы этой матрицы означают, что новые оси продолжают оставаться перпендикулярными к одной из центроидных осей. Так, оси С! и С2 остаются перпендикулярными к оси С3, а ось Сз к оси С2. Вра- щение осуществлено лишь в плоскостях, перпендикулярных к этим осям. В матрице в каждом столбце только два элемента отличны от' нуля. В строках таких элементов может быть больше двух. Таблица 9.1 Первое косое вращение радиальным методом Исходная Vo фактор- ная матрица 8 пере- K1=S1-D1 менных С, с, с, С2 Сз 1 2 3 4 5 6 0,465 0,675 0,656 0,720 0,572 0,566 0,686 0,530 —1,293 —0,475 0,000 0,287 0,325 —0,371 0,247 0,288 —0,271 0,434 0,042 0,058 0,207 —0 151 X Сх С2 СЙ XX2 0,4940 —0,08695 0,0000 1,000 0,5566 0,8308 0,0000 1,000 0,5145 0,0000 -0,8575 1,000 7 8 -0,538 0,243 Первая Vt матрица косоугольных поверну- тых факторов С, с2 сг 0,434 0,016 0,472 1 0,746 —0,019 —0,025 2 0,324 0,365 0,301 3 0,106 0,639 0,321 4 0,000 0,588 0,117 5 0,602 0,007 0,412 6 0,124 0,587 0,814 7 0,011 0,534 0,064 8 Направляющие числа Sr с[ С2 Сз С! 1,00 0,67 0,60 G — 1,76 1,00 0,00 с3 0,00 0,00 — 1,00 X/2 4,0976 1,4489 1,3600 V ъп 3,0242 1,2037 1,1662 D1 0,49402 0,83077 0,85749 Корреляции осей новой системы коор- динат Л41=Х{ • Xi С2 Сз С) С) С) СО -»ЬЭ 1,000 —0,447 0,254 —0,447 1,000 0,286 0,254 0,286 1,00 5. Нормализуем направляющие числа для определения направля- ющих косинусов. Из опыта перпендикулярного вращения мы знаем, что нормализация означает вычисление другой пары координат, сум- 156
ма квадратов которых равна 1. Для этого складываем квадраты направ- ляющих чисел и определяем величину S/2. Затем вычисляем квадрат- ные корни из этих величин |Л2/2. После этого направляющие числа де- лим на полученные значения. Обычно вместо деления осуществляется умножение элементов матрицы на величины, обратные корню квад- ратному. Эти величины обозначают Dr. Итак, первый столбец матрицы обозначенный С'ц вычисляется следующим образом (с округлением до четырех знаков после запятой): (1,00) х (0,49402) = 0,4940; (—1,76) х (0,49402) = —0,8695; (0,00) + (0,49402) = 0,0000. Второй столбец вычисляется следующим образом: (0,67) х (0,83077) = 0,5566; (1,00) X (0,83077) = 0,8308; (0,00) х (0,83077) = 0,0000. Наконец, операций: третий столбец определяется в результате следующих (0,60) X (0,85749) = 0,5145; (0,00) X (0,85749) = 0,0000; (—1,00) х (0,85749) = —0,8575. 6. Переходим к вращению, умножая матрицу Vo на матрицу 2ц для определения первой матрицы косоугольных повернутых факторов У, (табл. 9.1). С помощью рисунка проверяем факторные нагрузки матрицы У1г т. е. устанавливаем, соответствует ли расстояние отдельных точек от гиперплоскостей значениям факторных нагрузок. При косом вра- щении нельзя использовать способ проверки, заключающийся в рас- чете общности (Л2), так как он применим только к перпендикулярно- му вращению. 7. Вычисляем корреляции осей новой косоугольной системы коор- динат. Эти корреляции содержит матрица Мг. Она вычисляется умно- жением транспонированной матрицы трансформации 2.J на матрицу Таким образом, Л41 = 2.1'2Ч. Дадим развернутое изложение этой операции, чтобы читатель смог осуществить ее проверку и выполнение самостоятельно. Произведение матриц будет иметь вид: 0,4940 —0,8695 0,0000 0,0000 X 0,4940 0,5566 —0,8695 0,8308 0,5145 0,0000 =3 0,5566 0,8308 0,5145 0,0000 - -0,8575 1,000 —0,447 0,254 2 0,0000 —0 -0,447 0,254 1,000 0,286 0,286 1,000 И1 ,000 — 0,8575 2ц 157
Учитывая правила умножения матриц, последовательные произ- ведения будут иметь вид: 1. Первая строка на первый столбец А*: (0,4940) х (0,4940) + (—0,8695) х (—0,8695) + (0,0000) X (0,0000) = = 1,000. 2. Вторая строка X' на второй столбец Ах: (0,4940) X (0,5566) + (—0,8695) х (0,8308) + (0,0000) X (0,0000) = = —0,447. 3. Первая строка на третий столбец А,2: (0,4940) X (0,5145) + (—0,8695) X (0,0000) + (0,0000) х (0,8575) = = 0,254. 4. Вторая строка А/ на первый столбец (0,5566) х (0,4940) + (0,8308) х (—8695) + (0,0000) X (0,0000) = = —0,447. 5. Вторая строка Zj на второй столбец А^: (0,5566) х (0,5566) +(0,8308) х (0,8308) + (0,0000) х (0,0000) =--1,000. Аналогично выполняются остальные операции умножения. Необ- ходимо отметить, что результатом операций умножения всегда будет величина, находящаяся в матрице-произведении на пересечении строки и столбца с соответствующими номерами. Например, умножая вторую строку матрицы на второй столбец матрицы А1( получаем элемент матрицы Л4Ь находящийся на пересечении второй строки и второго столбца. В результате этих вычислений определяем полную корреляционную матрицу, у которой на главной диагонали находятся единицы. Остальные элементы этой матрицы отличны от нуля, что свидетель- ствует о косоугольное™ осей новой системы. Например, корреляция осей С{ и С2 довольно значительна, так как коэффициент корреляции в этом случае равен —0,447. На этом в принципе заканчивается первый этап косого вращения. Для проверки результатов и внесения попра- вок в целях получения большого числа нулевых нагрузок в матрице после поворота обратимся к новым рисункам (9.2) в плоскостях С[ОС2, C'lOCa и С2ОС3. При этом будем опираться на факторную матрицу При вычерчивании этих рисунков мы не учитываем того, что оси систе- мы координат косоугольны, и делаем их перпендикулярными, отмечая лишь на каждом рисунке коэффициент корреляций между каждой па- рой осей. Это делается потому, что при нанесении пары осей под углом, соответствующим корреляции, возникают трудности в размещении кон- фигурации точек и дальнейшем вращении. Такое упрощение допусти- мо, так как в плоскости С[ОС'2 С[ выполняет роль гиперплоскости для нормали Сг, и наоборот. Гиперплоскость и ее нормаль перпендикуляр- ны, и это для нас наиболее существенно. Далее выполняем следующие операции: 1. Изучаем рисунки 9.2, а, б, в и определяем поправки для дальней- ших вращений. Как и ранее, вычерчиваем следы гиперплоскостей (а2, ₽2 и у2) и нормали к ним (С'{, С"2 и Сз). По-видимому, нужны лишь не- 158
Рис. 9.2. Графики конфигурации точек 8 тестов в трех плоскостях, образован- ных тремя осями системы координат после косоугольного вращения радиальным методом большие вращения для получения простой структуры. Можно еще эли- минировать некоторые незначительные отрицательные нагрузки и уве- личить количество нулевых нагрузок, удаляя малые положительные нагрузки. 2. Так же, как и раньше, строим матрицу направляющих чисел S2 (табл. 9.2). Переходим к новой операции, которая не была нужна в первой стадии вращения. Речь идет о расчете матрицы L. 3. Матрица L получается в результате умножения предыдущей мат- рицы трансформации на новую матрицу направляющих чисел S2, т. е. L = Xj • S2. Матрицу L рассматриваем как новую матрицу на- правляющих чисел. Дальнейшая процедура аналогична выполненной на первой стадии. Вычисляем направляющие косинусы Л2 = LD2, являющиеся эле- ментами матрицы трансформации Х2, после чего умножаем исходную матрицу центроидных факторов Уо на Х2. В результате получаем вто- рую матрицу косоугольных повернутых факторов (табл. 9.2). Набор факторных нагрузок в этой матрице представляет собой при- мер ярко выраженной простой структуры, полученной путем косого вращения. Столбец С" этой матрицы содержит четыре, а столбцы С2 иСз— три нулевые факторные нагрузки. За исключением теста 3, имеющего большие нагрузки трех факторов, каждая строка содержит по крайней мере один нулевой элемент. Тест 2 включает лишь фактор CJ', а тесты 5 и 8 включают лишь фактор С2. Более того, матрица V2 не содержит больших отрицательных нагрузок. Все это говорит о том, что с помощью косоугольного вращения мы получили истинное и строго определен- ное решение, поддающееся психологической интерпретации. Посколь- ку в предыдущих разделах уже рассматривалась интерпретация фак- торов на примере шести переменных, мы не будем еще раз обсуждать это, тем более, что нашей основной целью была лишь иллюстрация самой процедуры косого вращения. Необходимо, однако, напомнить, об одной важной проблеме, свя- занной с методом вычисления косоугольных факторов. Речь идет о специальной проблеме, касающейся системы осей координат, с кото- 159
Таблица 9.2 Второе косое вращение радиальным методом Vo ^2—L'D3 Vg с, с, С, С"1 c'i Сз Cl Сз Сз 1 2 4 5 6 0,465 0,675 0,656 0,720 0,572 0,566 0,686 0,530 —0,293 —0,475 0,000 0,287 0,325 —0,371 0,247 0,288 0,271 0,434 0,042 0,058 0,207 —0,151 X сг с2 С8 S12 0,4181 —0,8958 0,1503 1,000 0,5863 0,8102 0,0000 1,000 0,4608 —0,1029 -0,8815 1,000 = 0,416 0,773 0,281 0,053 -0,021 0,546 -0,015 0,000 0,035 0,011 0,385 0,655 0,599 0,031 0,602 0,544 0,483 —0,023 0,265 0,251 0,048 0,432 0,765 0,000 1 2 3 4 5 6 7 8 —О;538 0,243 7 8 Направляющие числа S2 С1 Сз Сз CJ 1,00 0,04 0,00 с2 0,00 1,00 —0,12 Сз —0,17 0,00 1,00 Направляющие числа L; L=k1-S2 Ci Сз Сз Ci 0,406 0,576 0,448 Сз —0,870 0,796 —0,100 С3 0,146 0,000 —0,857 2/2 0,94305 0,96539 0,94515 У si2 0,97111 0,98254 0,97219 D2 1,0297 1,0178 1,0286 Корреляция осей М2—\'2-К2 С1 Сз Сз Ci Сз Сз' 1,000 —0,481 0,152 —0,481 1,000 0,187 0,152 0,187 1,000 рой мы сталкиваемся в процессе косого вращения. Эта система отли- чается от той, которая использовалась при перпендикулярном враще- нии. В чем это различие? Оси, соответствующие факторам, определяе- мым при помощи факторного анализа и имеющие какое-то психологи- ческое, социологическое или другое значение, являются в принципе линиями, представляющими собой пересечение гиперплоскостей, на что обратил внимание Тэрстоун. Понять это поможет рисунок 9.3, соответствующий трехмерному случаю с тремя перпендикулярными осями Съ С2 и С3. Соответствующие гиперплоскости будут определять- ся парами осей. Например, гиперплоскость а определяется осями С2 и С3, гиперплоскость 0 — осями Сг и С3 и т. д. Как видим, эти оси действительно лежат на пересечениях гиперплоскостей а, |3 и у. Такие взаимно перпендикулярные оси системы координат, которые в то же время являются пересечениями гиперплоскостей, называются неход- ко
ными осями. Эти оси можно рассматривать как представляющие истин- ные психологические факторы. Теперь необходимо отметить, что в перпендикулярной системе ис- ходные оси являются одновременно нормалями к гиперплоскостям. Например, ось С3 представляет собой нормаль к гиперплоскости у, ось С2 — к гиперплоскости 0 и т. д. Иначе в случае косого вращения, в котором гиперплоскости наклонены друг к другу под различными углами, отличающимися от прямого. Поскольку нормали продолжают и далее оставаться перпендикулярными к своим гиперплоскостям, что вытекает из их определения, они не будут совпадать с линиями пере- сечения плоскостей. Эту ситуацию иллюстрирует рисунок 9.4. Оси Съ С2 и С3 — это пересечение гиперплоскостей оси Sx, S2 и S3 — нор- мали к соответствующим гиперплоскостям. Как видим, оси Slf S2, S3 несколько отклоняются от исходных осей Съ С2 и Са, причем это от- клонение зависит от степени корреляции между гиперплоскостями. Факторные нагрузки, определенные методом косого вращения, яв- ляются проекциями векторов соответствующих переменных на нормали гиперплоскостей, образующих систему координат, а не на исходные оси. В результате факторные нагрузки, определенные методом косого вращения, не отражают, строго говоря, корреляцию данной перемен- ной с фактором, которому придается какое-то психологическое значение. Очевидно, что часто корреляции между гиперплоскостями незначи- тельны и в связи с этим незначительны также отклонения нормалей от исходных осей. Поэтому практически можно считать, что разница между факторными нагрузками, определенными на основе нормалей и на основе исходных осей, настолько незначительна, что ею можно пре- небречь. Факторную матрицу, вычисленную при помощи методов ко- сого вращения, можно трактовать поэтому так же, как матрицу, рассчи- танную путем перпендикулярного вращения. Если, однако, в некото- рых случаях речь идет об определении точных значений факторных на- грузок, т. е. о проекциях вектора данной переменной на исходную ось, соответствующую какому-нибудь психологическому или социологи- ческому фактору, нужно путем некоторых перерасчетов преобразовать 161
матрицу косоугольных факторов в такую матрицу, которая включает точные величины корреляции переменных с исходными осями. Методы такого пересчета очень кропотливы и трудоемки, и мы не будем их здесь рассматривать. Однако для случаев с небольшим числом факторов существует прямой метод определения точных факторных нагрузок в процессе косого вращения, разработанный Харрисом. Учитывая рамки данной работы, мы не будем его рассматривать. Заинтересован- ный читатель может найти его изложение в более фундаментальных ра- ботах по факторному анализу (см., например, [101]). 2. ФАКТОРЫ БОЛЕЕ ВЫСОКИХ ПОРЯДКОВ Если, как отмечалось, оси факторов коррелируют между собой, образуя косоугольные системы, то в этом случае можно трактовать ко- соугольные факторы так же, как до сих пор трактовались переменные (тесты). Тогда можно отыскивать связки осей, представляющие факто- ры (связки «факторных» векторов), и стремиться определять факторы, вызывающие указанную корреляцию. Это будут своего рода факторы среди факторов. Они называются факторами второго порядка. Для определения этих факторов нужно прежде всего собрать до- вольно большое количество исходных переменных (например, тестов), подобранных таким образом, чтобы анализ матрицы их корреляций дал достаточное количество «обычных» факторов, например 10—12. Теперь необходимо как можно более точно определить корреляции между ними путем косого вращения. Определив матрицу корреляции косоуголь- ных факторов, можно подойти к факторам второго порядка при помощи обычных «классических» методов расчетов факторов и вращения. Тео- ретически можно говорить о факторах, выделенных из факторов вто- рого порядка, т. е. о факторах третьего порядка, и соответственно о фак- торах следующих, более высоких порядков. До настоящего времени усилия исследователей сосредоточивались на определении факторов второго порядка. Поскольку эти факторы общие, что обусловливается способом их расчета, то факторов второго порядка меньше, чем факто- ров первого порядка. Эти факторы позволяют более глубоко проникнуть в причины изменений, существующих на поверхности явлений. До на- стоящего времени не удалось накопить большого опыта в этой области, а потому вряд ли можно делать какие-либо обоснованные обобщения. Удалось установить лишь один из таких факторов второго порядка, находящийся за пределами связки коррелированных факторов индиви- дуальных особенностей. В эту связку наряду с другими входят такие факторы первого порядка, как, например, эмоциональное равновесие, а также доминирование и подчинение. Природу фактора второго по- рядка, находящегося вне этой связи, трудно определить. Предпола- гается, что речь идет о каком-то факторе общественного положения. Над этой проблемой работал Тэрстоун. Среди ряда факторов способ- ностей он обнаружил один фактор второго порядка и дал ему лучшее обоснование. Большинство авторов считает, что речь идет о факторе 162
второго порядка, соответствующем «общей одаренности» Спирмэна, обозначаемой символомВ таком случае это будет какой-то общий фак- тор, влияющий на направление развития основных способностей. При этом необходимо еще раз подчеркнуть, что из-за недостаточности экспе- риментального материала всякие рассуждения на этот счет лишены оснований. Пока неизвестно, будет ли влияние других факторов вто- рого порядка выходить за рамки группы психологических, социоло- гических или физиологических факторов. Имеющиеся данные позво- ляют утверждать, что корреляции между факторами первого порядка, как правило, незначительны и редко превышают 0,4. В исключитель- ных случаях коэффициент корреляции может быть равен 0,6. Некоторые исследователи, например Дж. П. Гилфорд, весьма кри- тично настроены в отношении факторов более высоких порядков. Прежде всего они высказывают сомнение в надежности корреляции меж- ду факторами первого порядка. В значительной степени эти корреля- ции могут определяться условиями исследований, разнородностью со- вокупности и другими побочными влияниями. На положение гиперплос- костей при косом вращении влияет также в случае психологических исследований подбор тестов в серии.
Глава десятая ОСНОВНЫЕ ПРИНЦИПЫ ОРГАНИЗАЦИИ ИССЛЕДОВАНИЙ МЕТОДАМИ ФАКТОРНОГО АНАЛИЗА 1. НЕКОТОРЫЕ ОБЩИЕ ПОЛОЖЕНИЯ Результаты, получаемые с помощью методов факторного анализа, зависят от ряда условий. Многие из них упоминались при рассмотрении самой процедуры вычислений и связанных с ними теоретических проб- лем. Остается еще обсудить влияние, оказываемое условиями сбора основных данных, используемых в анализе, на число и вид факторов и величину их нагрузки по отдельным переменным. Кроме того, нужно кратко обсудить общие принципы планирования экспериментов, про- водимых с использованием факторного анализа. Каждая область при- ложения характеризуется своими проблемами, обусловленными ее специфическими особенностями. Мы ограничимся проблемами, связан- ными лишь с областью психологии. Учитывая то, что в психологии на- коплен большой опыт различных тестов, дальнейшие рассуждения будут основываться на примерах именно психологических тестов. При этом нужно предостеречь от узкого понимания слова «тест» как средства, используемого на практике для подбора кадров и профессиональной ориентации. Говоря о тестах в связи с факторным анализом, мы имеем в виду все их разновидности и применения как для практических, так и для чисто научных целей. 164
2. СТЕПЕНЬ ТРУДНОСТИ ТЕСТОВ Очень часто в практике психологических исследований используют- ся классические тесты способностей. В этом случае основное значение имеет проблема степени трудности тестов. Очевидно, о трудности теста можно говорить лишь в отношении данной группы обследуемых лиц. Один и тот же тест может быть для одной группы легким, для другой — трудным. Не представляется возможным подробно рассмотреть общие проблемы статистики, а потому подчеркиваем лишь, что для целей фак- торного анализа оптимальной будет такая степень трудности теста, ко- торая дает симметричные распределения результатов, соответствующие в приближении известной кривой Гаусса. Менее желательны несим- метричные и усеченные распределения, возникающие в случаях, когда тест для данной выборки был или слишком легким или слишком труд- ным. Важно, чтобы коррелируемые тесты были одинаковыми по трудности. Если вычисляются корреляции тестов, значительно отличающиеся трудностью, то получаются меньшие коэффициенты корреляции, чем в случае тестов одинаковой трудности. Нужно стремиться к тому, чтобы все тесты в изучаемой серии были одной трудности. Тогда достигается желательная унификация степени трудности. Необязательно, чтобы это был средний уровень. Можно подобрать совокупность тестов, трудность которых превышает-средний уровень. Существенно то, чтобы все тесты были одинаково сложными. 3. ПРОЦЕДУРА ОЦЕНКИ РЕЗУЛЬТАТОВ И СКОРОСТЬ ИХ ДОСТИЖЕНИЯ Результаты тестов можно анализировать по-разному в зависимости от типа теста и его конструкции. Необходимо учитывать то, что измене- ния в способе оценки результатов могут существенно влиять на фак- торный состав теста. Как известно, самым распространенным способом опенки результатов является число правильных и ошибочных ответов и иногда разница между ними; обычно считается, что при анализе ре- зультатов по правильным ответам или по числу ошибок полученные оценки почти эквивалентны, причем характер оценок изменяется на противоположный. Если решения правильные, то общая оценка будет выражать ступень успеха в выполнении теста, напротив, сумма ошибок является мерой неудачи.Если речь идет о задачах, решаемых с помощью факторного анализа, то целесообразно использовать единую систему оценки, когда конструкция тестов дает эту возможность. Бывает и так, что корреляция оценок, полученных в результате использования двух указанных правил, очень низка или даже равна нулю. Это указывает на то, что они включают разные факторы. Поэтому целесообразно анали- зировать отдельно оценки с учетом правильных и ошибочных ответов. Вторая заслуживающая внимания проблема относится к скорости выполнения заданий ввиду ограниченности времени. Степень, с кото- рой скорость работы влияет на данный тест, определяет его факторные 165-
Нагрузки. Оказывается, что оценки скорости работы и ее качества свя- заны между собой различным образом: от высоких положительных до ярко выраженных отрицательных корреляций. Во многих исследова- ниях были определены общие факторы скорости работы на основе ана- лиза соответствующим образом подобранных тестов, в которых решаю- щую роль играл темп выполнения. Интересно, что чем «быстрее» тесты, тем больше вероятность, что оценки на основе правильных и ошибоч- ных ответов будут независимы. Наоборот, в заданиях, где фактор ско- рости не имеет никакого значения и общая оценка относится исключи- тельно к качеству работы, эти два способа оценки (правильно или не- правильно) дают корреляции, достигающие значения —1,0. О значении надежности наблюдений мы уже говорили в разделе корреляции и поэтому здесь мы не будем подробно рассматривать этот вопрос. Отметим лишь, что малая надежность теста увеличивает дис- персию вследствие ошибки, в результате чего, выражаясь языком гео- метрии, уменьшается вектор теста. Вспомним, что длина вектора со- ответствует только общей дисперсии. Чем больше ошибок при вы- полнении теста в процессе исследования, тем меньше улавливается на- дежная дисперсия, включающая общую и специфичную дисперсию. Однако не изменяется направление вектора и связанная с этим основ- ная факторная структура. Напротив, слишком короткие векторы со- здают большие трудности в процессе вращения, когда нужно опреде- лить направление и угол перемещения осей. 4. ПРОБЛЕМА МОТИВАЦИИ Говоря о надежности тестов, необходимо вспомнить о чрезвычайно важной и обычно недооцениваемой проблеме. Речь идет об отношении к тестам со стороны лиц, их выполняющих, или о проблеме мотивации. Для разных видов тестов мотивация различна. В случае типичных тес- тов способностей очень важно, чтобы при их выполнении вся группа людей работала с максимальным напряжением и была нацелена на до- стижение наилучших результатов. В некоторых случаях обстоятель- ства, в которых осуществляются исследования, создают благоприятные возможности для соответствующей мотивации. С такой ситуацией стал- киваются иногда в практике изучения квалификации, когда человек особенно зависит от результатов (получение работы, допуск к учебе и т. п.). Однако в этом случае могут существовать другие возмущающие факторы, такие, как торможение из-за эмоциональных волнений, про- являющиеся особенно у некоторых людей, страдающих неврозом. Если эксперимент имеет чисто научные цели, он может включать группы лю- дей, которые сотрудничают с нами в совершенно иной ситуации. Иног- да это могут быть добровольцы, заинтересованные в самом исследова- нии, иногда совершенно случайные люди, на худой конец, люди, отно- сящиеся к тесту безразлично или без энтузиазма. Иногда так бывает при экспериментальных исследованиях в группе учеников различных школ. В таких случаях проблема мотивации становится очень трудной. Большое значение имеют здесь, очевидно, чуткость и умение исследо- 166
вателя, который должен соответственным образом настроить обследуе мых. Одним из наилучших путей будет создание атмосферы товари- щеского соревнования, в котором каждый стремится к достижению мак- симальных результатов. Иначе обстоит дело при использовании различных тестов для изу- чения индивидуальных особенностей. В наибольшей степени это отно- сится к случаю использования анкет с данными о темпераменте, инте- ресах и т. д. Здесь некоторые мотивации могут быть нежелательными. Атмосфера соревнования и стремление показать себя в наиболее бла- гоприятном свете может привести к искажению результатов. Наиболее желательным в таких случаях является чувство готовности к важ- ному и доброжелательному сотрудничеству с экспериментатором. Соз- дать такую атмосферу в большой группе обследуемых нелегко. 5. ОБСЛЕДУЕМАЯ ГРУППА Очень серьезная проблема подбора группы людей из генеральной совокупности должна решаться с учетом правил, общих для всех экспе- риментальных исследований. Некоторые из обязательных правил имеют особое значение в случае экспериментов, организуемых для про- ведения факторного анализа. Здесь нужно так подбирать группы, что- бы факторная структура проявлялась особенно ярко. Поэтому нужна группа, максимально однородная прежде всего с точки зрения пере- менных, влияние которых целесообразно элиминировать. Речь идет о том, чтобы эти переменные не играли роль тех общих факторов, кото- рые нас в данном случае не интересуют. Напротив, в отношении резуль- татов, которые мы стремимся выделить и исследовать, нужно стараться подобрать выборку таким образом, чтобы индивидуальные различия были как можно большими. Например, если в данном эксперименте пас интересуют какие-либо свойства личности, то нужно по мере возмож- ности подбирать группу, неоднородную по этим свойствам. В то же вре- мя эта группа может быть однородной по возрасту, который как фак- тор нас в данном случае не интересует. Некоторые авторы подчеркивают, что в принципе целесообразно всегда элиминировать такие тривиальные факторы, как возраст, пол и уровень образования. Главным доводом в пользу такого мнения яв- ляется то, что если какие-либо интересующие нас факторы сильно кор- релируют с возрастом, полом или образованием, то в результате анали- за эти факторы получаются коррелированными друг с другом (косо- угольными), тогда как в действительности это не так. Особенно нежела- тельно объединять данные, полученные из разных тестов, для увеличе- ния этим путем числа обследуемых. Если в отдельных группах сущест- вуют значительные различия средних результатов некоторых тестов, нужно прибегать к некоторым предварительным статистическим при- емам, прежде чем объединять материал из разных источников. Одним из таких приемов является вычисление отдельных корреляционных матриц для каждой из выборок и определение средних коэффициентов корреляции для построения итоговой общей матрицы. 167
6. ПРАВИЛЬНАЯ ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА Методы факторного анализа очень трудоемки, требуют больших за- трат труда на кропотливые расчеты. Если эксперимент основывается на предположениях, не продуманных до конца, то не только большие усилия всего коллектива сотрудников окажутся напрасными, но и, что еще хуже, ошибочные результаты, облеченные в математическую форму, могут вывести во многих случаях на ложный путь и затруднить выяснение важных проблем. Это же относится и к другим областям науки, в которых предпринимаются попытки использования фактор- ных методов. С этой точки зрения необходимо в максимальной степени избегать поспешных и недостаточно обоснованных экспериментов, связанных с факторным анализом. Осторожная и тщательная организация плани- руемого эксперимента вплоть до малейших деталей оплачивается сто- рицей и позволяет избежать как ошибочных выводов, так и напрасных затрат кропотливого труда. В литературе по факторному анализу неоднократно обсуждались вопросы, связанные с организацией факторно-аналитических работ. Рассмотрим кратко важнейшие из них: 1. Большое значение имеет сознательный и обдуманный выбор проблемы. Как единодушно отмечали многие авторы, ряд опублико- ванных работ по факторному анализу создает впечатление,что исследуе- мая проблема была как бы подсказана внешними случайными обстоя- тельствами или что изучается та проблема, которую наиболее выгодно исследовать в данный момент. Нельзя применять факторный анализ к любой корреляционной матрице, пусть даже ее в данных условиях легче всего определить. Такой подход, как правило, не дает ценных результатов. Ясно, что всегда можно изучать какие-то корреляции и всегда будут получаться какие-то факторы. Другое дело, каков их смысл. К типичным ошибкам такого рода относится подбор серии тестов, которые наиболее доступны в данных условиях. Не все тесты, пусть да- же в определенных условиях полезные, годятся для целей факторного анализа. Особая осторожность нужна в отношении анкет и других вопросников, используемых для изучения индивидуальных особеннос- тей. Нужно начинать с ясного и однозначного определения проблемы, которая будет исследоваться, и при выборе тестов исходить из всего теоретического задела данной науки. Лишь в редких случаях можно использовать готовые тесты, пусть даже они широко распространены, без каких-либо изменений и адаптации. В области факторного анализа существуют проблемы, имеющие различный характер. Это могут быть весьма широкие проблемы, например «факторы индивидуальных осо- бенностей», или такие специальные проблемы, как «фактор пространст- венного воображения в визуальных наблюдениях». Нужно, однако, проявлять осторожность при изучении слишком узких проблем, по- скольку в этом случае все тесты в серии могут быть настолько похожи- ми, что специфичные факторы будут иметь характер общих. В общем 168
чем шире проблема, тем больше факторов можно определить при ис- пользовании факторных методов. Выше уже излагались принципы, с учетом которых определяется минимальное число анализируемых пе- ременных, необходимых для обоснования некоторого числа факторов. Используемых здесь критериев много, так же, как и проблем, решае- мых различными авторами. Одно не подлежит сомнению: целесообраз- но, чтобы число переменных превышало его нижнюю допустимую гра- ницу. Рекомендуется, чтобы число тестов в три раза превышало число возможных факторов. В этом случае можно быть уверенным в том, что результаты будут хорошо обоснованы. Кроме того, на самом трудном этапе работы — вращении к простой структуре — мы будем в состоя- нии однозначно определить наилучшее положение вращаемых осей. 2. Подбор изучаемой группы также имеет большое значение при организации эксперимента с использованием факторного анализа. Не- которые связанные с этим вопросы уже были рассмотрены. Поэтому мы обсудим лишь проблему численности группы, в которой будет прово- диться исследование. Здесь существует общее правило, диктуемое ста- тистикой, в соответствии с которым группа должна быть репрезентатив- на по отношению к генеральной совокупности, т. е. представлять собой хорошую выборку. Только в этом случае можно делать выводы о гене- ральной совокупности на основе результатов, полученных в выборке. Нужно помнить, что в факторном анализе численность группы сильно влияет на систему факторных нагрузок. Поэтому интерпретация фак- торов, полученная в результате изучения малочисленной группы, мо- жет привести к ошибкам. Малообоснованные результаты осложняют идентификацию факторов, определенных в различных исследованиях. Строгие правила в отношении численности группы по-разному фор- мулируются различными авторами. Обычно принимается, что при ис- пользовании коэффициента корреляции Пирсона число людей в группе (N) не должно быть меньше 200. Однако в специальной литературе можно встретить указания на то, что правильные и ценные результаты были получены на основе меньших групп, включающих 150—180 че- ловек. В любом случае факторные структуры для групп, численность которых приближается к 200, при прочих равных условиях сущест- венно не изменялись при увеличении группы до 500 и более человек. 3. Следующая важная проблема — выбор подходящего метода оп- ределения факторов. Эта проблема уже обсуждалась при изложении основных видов процедуры факторного анализа. Отметим здесь лишь, что основным является центроидный метод, имеющий наиболее широкую область применения, и прежде всего там, где не требуется высокая точность факторных нагрузок и речь идет лишь о первых выводах в от- ношении существующей структуры. Очень трудоемкие методы, напри- мер максимального правдоподобия Лоули, годятся скорее всего для тех областей, где основные черты структуры факторов уже известны и речь идет в основном об уточнении и выделении глубоких и тонких причин изменений. Наконец, как уже отмечалось, эти методы требуют таких затрат труда, что часто бывает трудно их использовать на прак- тике при отсутствии многочисленного и хорошо подготовленного кол- 6 Зак. 377 169
лектива специалистов и без необходимого технического обеспечения. Быстрое выполнение таких исследований на большом материале воз- можно лишь при широком использовании электронных вычислитель- ных машин. 7. НАУЧНЫЙ ОТЧЕТ Остается рассмотреть еще вопрос правильного составления отчетов об исследованиях с применением факторного анализа. Здесь совершает- ся много ошибок, и значительная часть опубликованных работ и сооб- щений построена таким образом, что контроль всего процесса работы и всех деталей метода очень труден или даже невозможен. Отчет о фак- торных исследованиях должен быть полным, чтобы читатели могли проверить результаты и контролировать расчеты. Это, по существу, общее правило, обязательное для всех научных публикаций, общий принцип изложения всего информационного материала, необходимого для оценки применяемых методов и проверки достигнутых результатов. Учитывая сложный характер факторных исследований, этот принцип представляется особенно существенным. Рассмотрим вкратце все ос- новные элементы, которые нужно учитывать при составлении отчетов об исследованиях с использованием факторных методов. Прежде всего необходимо точно описывать применяемые методы и инструменты наблюдений. Переменные, подвергаемые анализу, должны быть исчерпывающим образом охарактеризованы. В случае серии тестов каждый из них должен быть подробно описан; в случае «бумажных» тестов нужно описать содержание и структуру всех эле- ментов теста или дать однозначный символ для хорошо известных тес- тов. Если использовалась аппаратура, нужно привести схемы и фото- графии и описать важные детали конструкции. Подробно должны быть описаны инструкции для обследуемых и для исследователя, которых нужно придерживаться в ходе эксперимента. Необходимо также определить все специальные условия, которые должны соблюдаться в эксперименте, с указанием всех обстоятельств, имеющих какое-то значение для результатов (время дня, психическое и физическое состояние обследуемых, отношение изучаемой группы к выполнению тесга и т. д.). Далее подробно должны быть описаны способы оценки результатов (шкала оценок, подсчет очков и т.п.) и допустимое время выполнения отдельных заданий, если это время было ограничено. Нужно также привести коэффициенты надежности тестов и подробно описать метод, которым они были рассчитаны. Должны быть приведены следующие статистические показатели: рас- пределения результатов, средние арифметические и стандартные откло- нения. Если распределения отличаются от нормальных, т. е. имеют скошенный или асимметричный вид, нужно привести их параметры. Следующий важный момент — выборка, на основе которой проведе- но исследование. Она должна быть подробно описана с указанием прежде всего возраста, пола и образования обследуемых лиц. Большое значение имеет информация о месте проведения обследования (город, село, область), социально-экономическом положении обследуемых 170
И т. д. Наконец, нужно указать численность группы, т. е. размер вы- борки (в терминах статистики). Если использовался специальный ме- тод выборки, он должен быть описан. Что касается самой процедуры факторного анализа, то прежде все- го нужно изложить примененный метод расчета меры корреляций вмес- те с его обоснованием. Это касается и выбора метода расчета факторов. Отчет должен содержать хотя бы в кратком виде аргументацию в поль- зу выбранного метода, в дальнейшем необходимо привести полную матрицу исходных коэффициентов корреляции и матрицу выделенных факторов. Целесообразно описать критерий, использованный для оп- ределения достаточного количества факторов. Можно не рассматри- вать всю процедуру расчетов и всех повторяющихся операций, особен- но тогда, когда размеры публикации ограничены. В то же время необ- ходимо привести матрицу остатков корреляций после выделения по- следнего фактора. В случаях, когда объем публикации должен быть уменьшен из-за недостатка места (например, в журналах), можно привести лишь половину симметричной матрицы корреляций, исполь- зовав вторую половину для записи окончательных остатков корреляции после расчета всех факторов. Подробно должна быть описана процедура вращения. Нужно дать обоснование выбора того или иного метода и указать причины выбора перпендикулярного или косого вращения. В каждом случае необхо- димо приводить матрицу трансформации X и окончательную матрицу повернутых факторов. Если применяется метод косого вращения, нуж- но привести косинусы углов между осями координат (матрица /И). Иногда возникает необходимость определения факторных нагрузок, спроектированных на исходные оси. Публикация должна включать рисунки, использованные в процессе вращения осей. Заключительная часть работы должна содержать полное изложе- ние интерпретации факторов. При этом целесообразно по мере возмож- ности давать ссылки на близкие по тематике работы для сравнения результатов и формулировки окончательных выводов. 6*
ЗАКЛЮЧЕНИЕ В данной работе кратко рассмотрены важнейшие проблемы фактор- ного анализа. При этом мы не стремились к их глубокому и всесторон- нему изложению по причинам, упомянутым во введении. Мы пытались также продемонстрировать вычислительную процедуру центроидного метода, являющегося основным и широко распространенным на прак- тике, чтобы читатель получил возможность приступить к самостоятель- ным попыткам использовать этот метод для анализа конкретного мате- риала. Остается еще отметить, что, учитывая вводный, ознакомитель- ный характер работы и ее ограниченные рамки, мы сознательно опу- стили ряд более тонких и одновременно существенных проблем фактор- ного анализа. Например, не рассматривались хорошо разработанные в специальной литературе графические методы вращения, были опуще- ны также проблемы, касающиеся предвидения результатов отдельных людей при выполнении определенных заданий с учетом систем фактор- ных нагрузок. Не затрагивались проблемы статистических критериев, которые приобретают все большее значение в факторном анализе. Со всеми этими проблемами заинтересованный читатель сможет ознако- миться в фундаментальных работах или специальных исследованиях по факторному анализу. Для облегчения таких поисков в конце книги приведена довольно обширная библиография, составленная так, чтобы ознакомление с ней создало по возможности полную картину основных направлений исследований. В заключение необходимо уделить немно- го внимания прежде всего проблеме возможного использования фак- торного анализа в психологии. При этом вкратце будут упомянуты не- которые наиболее дискуссионные проблемы, связанные с основными предположениями факторного анализа. По мнению многих видных представителей факторного анализа, су- ществуют два основных направления возможного использования фак- торных методов. Первое из них и в то же время основное — это вклю- чение факторного анализа как вспомогательного инструмента в про- цесс разработки проблем, имеющих фундаментальный, теоретический характер. На этом пути факторные методы могут оказаться весьма цен- ными, а в некоторых случаях привести даже к решению спорных вопро- сов. 172
Вторая возможность — это чисто практическое применение, преж- де всего в таких отраслях прикладной психологии, как психология труда, клиническая или воспитательная психология. Здесь факторный анализ может содействовать совершенствованию методов решения прак- тических задач, которые ставятся перед психологами промышлен- ностью, связью, образованием и другими отраслями. Попытаемся проиллюстрировать с помощью нескольких примеров эти два основных направления использования факторного анализа. Что касается теоретических проблем психологии, к решению кото- рых привлекается факторный анализ, то на первом плане находится изучение структуры способностей. Исторически, как мы уже знаем, факторный анализ возник именно при изучении Спирмэном структуры умственных способностей. Исследования в этой области быстро расши- рялись за счет включения и других видов способностей, а с момента создания Тэрстоуном основ многофакторного анализа поиск основных факторов этого типа стал опираться на глубокие теоретические основы. Тэрстоун, как известно, вскрыл при помощи методов многофактор- ного анализа некоторое число основных факторов, которые были наз- ваны им первичными, или основными, способностями. Существует еще ряд открытых вопросов (касающихся способностей), которые, по мне- нию представителей факторного анализа, могут быть в основном решены с помощью факторного подхода. Например, важную, горячо дискути- руемую проблему о том, в какой мере способность может быть сформи- рована путем упражнений, можно сформулировать более конкретно с помощью факторного анализа. Исследования должны идти в направ- лении определения того, насколько каждая из основных способностей может сформироваться в результате обучения. В процессе развития факторного анализа область его применения вышла за рамки способностей, включив в себя прежде всего такое важное направление, как психология личности. Одно из важнейших достижений здесь связано с именем Р. Б. Кеттелла, опубликовавшего в 1946 г. большую работу, посвященную проблеме личности. Эта работа использовала факторный анализ и его результаты. В этом на- правлении также удалось определить основные факторы личности. Исследования опирались главным образом на данные, полученные при помощи различных анкет, включавших вопросы личного характе- ра. Есть также работы в области проекционных методов, например тес- тов Роршаха. Этим не ограничивается область применения факторного анализа. В богатой литературе по предмету встречаются работы и по другим на- правлениям, не связанным с проблемой индивидуальных различий. Например, есть работы по использованию факторного анализа в пси- хологии визуальных и слуховых наблюдений. Ряд исследователей зани- мался такими специальными проблемами, как анализ эстетических суж- дений или чувства юмора. Экспериментальная психология выдвигает большое количество различных проблем, в которых решающую роль играют глубинные процессы. Исследование таких процессов, как обуче- ние, память, мышление, мотивация и т. п., опирается, как правило, на 173
какие-либо виды оценок или наблюдений, которые имеют факторный характер. Существующие здесь базисные психологические переменные, трактуемые гипотетически и описательно, в принципе скрыты глубоко под поверхностью явлений. Применение факторного анализа во всех таких случаях может в значительной степени содействовать объясне- нию и познанию ситуации. Самой широкой областью практического использования достижений факторного анализа является, как и ранее, психология труда и воспи- тания, точнее говоря, проблема выбора профессии и профессиональ- ной ориентации. Здесь в связи с использованием факторного анализа было разработано много тестов, применяющихся в промышленности и связи и в различного вида школах. С помощью факторных методов в США разработано большое число тестов, использующихся для под- бора и подготовки персонала различных учреждений. В настоящее вре- мя проявляется интерес к анализу требований, которые ставятся перед людьми определенных профессий. Факторный подход к отдельным профессиям позволит сознательно и целенаправленно конструировать методы подбора, которые будут опираться на системы факторов. В заключение вспомним о некоторых сомнениях, высказываемых в адрес факторного анализа. Одно из них связано с чисто количест- венным математическим характером метода, могущим порождать фор- мализм и отрыв от реальной конкретной основы фактов. Действитель- но, некритическое использование статистических показателей, какими, несомненно, являются факторные нагрузки, может быть чревато такими последствиями. Однако мы полагаем, что более глубокое изучение ме- тода может сгладить эти опасения. При использовании факторного ана- лиза решающим моментом является интерпретация рассчитанных фак- торов, т. е. переход от количественного к качественному анализу. Ко- личественные показатели, какими являются факторные нагрузки, имеют лишь некоторое косвенное значение: их система при анализи- руемых переменных свидетельствует просто о существовании фактора определенного вида, т. е. представляет собой след, определяющий на- правление интерпретации. Чтобы такой след выводил на правильный путь, должны, очевидно, выполняться различные условия, которые рассматривались при обсуждении процедуры факторного анализа. На- пример, основу факторного анализа составляют коэффициенты корре- ляции. Если они вызывают сомнения, то вся процедура теряет смысл. Поэтому первым основным условием является точность наблюдений и расчет коэффициентов, выражающих реальные зависимости. Иногда говорят, что понятие «фактора» излишне усложняет пробле- му в результате введения в анализ промежуточного звена, не нужного для выяснения проблемы. Рассмотрим это на типичном примере, взятом из психологии труда. Допустим, что психолог, ведущий исследования в области подбора кадров, определил положительную корреляцию между результатами определенной серии тестов и каким-либо крите- рием успешного выполнения данного вида работы. В этом случае мож- но утверждать, что эффективность (диагностичность) данной серии тес- тов была подтверждена экспериментально. С точки зрения «приклад- 174
ника» этого достаточно, поскольку для него безразлично, какие глу- бинные процессы находят отражение в тестах. Однако часто оказы- вается, что та же самая серия тестов, реализованная в другой группе людей, никак не коррелирует с критерием, т. е. такая корреляция близка к нулю. Не зная факторной структуры как тестов, так и приме- ненного критерия, нельзя объяснить такого удивительного поворота событий. Если неизвестны причина данной корреляции и вызывающие ее общие факторы, то неизбежны большие ошибки. Случайно подобран- ные тесты имеют очень сложную факторную структуру. Не зная ее, нельзя предвидеть изменения, которые произойдут при использовании тестов в других обстоятельствах, например в группе лиц, подобранных иначе с точки зрения возраста, образования и т. п. При этом можно неосознанно элиминировать именно тот фактор, который прежде вы- зывал корреляцию. Утверждают также, что факторы — это статистические показатели, не учитывающие динамики развития личности и происходящих в ней изменений. Представляется, что такие аргументы слабо обоснованы. Никакие предположения факторного анализа не требуют такой ста- тичности факторов, факторы могут с тем же успехом выражать влия- ния биологического характера, как и влияния, обусловленные средой. Эти факторы могут быть относительно постоянными или быстро изме- няться, быть статичными или динамическими. Каждый выделенный фактор может и должен изучаться с учетом его характера, времени дей- ствия, связи с другими факторами и других обстоятельств. Мы не имеем возможности глубоко рассмотреть здесь все проблемы, связанные с факторным анализом и являющиеся предметом дискуссии. В заключение целесообразно подчеркнуть еще раз, что наилучший путы к определению собственного отношения ко всем спорным вопросам за- ключается в глубоком усвоении факторной теории и накоплении опы- та в области критического и продуманного применения его методов для анализа конкретного материала.
важнейшие термины ВСТРЕЧАЮЩИЕСЯ В ФАКТОРНОМ АНАЛИЗЕ Биполярный фактор. Фактор, имеющий одинаковое число положи- тельных и отрицательных нагрузок. Вектор отсчета. Лежит на линии пересечения всех гиперплоскос- тей пространства за исключением той гиперплоскости, которая иссле- дуется применительно к данному вектору отсчета. Вектор теста. Вектор, соединяющий начало координат с точкой в «-мерном пространстве. Генеральный (general) фактор. Фактор, соответствующий всем эле- ментам данного множества переменных. Гиперплоскость, ^-мерное подпространство, содержащееся в п- мерном пространстве (k п). Одномерной гиперплоскостью назы- вается прямая линия, двумерной — плоскость. В «-мерном пространст- ве существует лишь одно направление, перпендикулярное данной (п — 1)-мерной гиперплоскости. Поэтому через каждую точку «-мер- ного пространства проходит только одна (п — 1)-мерная гиперпло- скость, перпендикулярная данному направлению. В трехмерном про- странстве каждая ось системы координат определяет только одну пер- пендикулярную к нему плоскость, проходящую через начало коорди- нат. В «-мерном пространстве каждая ось определяет только одну (« — — 1)-мерную гиперплоскость, перпендикулярную к нему и проходящую через начало координат. Групповой метод расчета факторов. Метод определения факторов, при котором одновременно учитываются лишь некоторые выбранные переменные (не меньше 3 или 4). Двухфакторный метод определения факторов. Метод выделения факторов, который приводит к расчету одного фактора, общего для всех переменных данной совокупности, и ряда факторов, имеющих положи- тельные нагрузки у отдельных групп внутри совокупности перемен- ных. 176
Диагональная матрица. Квадратная матрица, все элементы кото- рой равны нулю, за исключением тех, которые лежат на диагонали, проходящей из левого верхнего угла до правого нижнего угла матрицы. Дисперсия. Сумма квадратов отклонений от средней всех элементов данного множества оценок или измерений, деленная на число элемен- тов. Единичная матрица. Диагональная матрица, все элементы которой равны единице. Квадратная матрица. Матрица, в которой число строк равно числу столбцов. Конфигурация векторов. Система векторов, представляющих пере- менные, независимая от системы координат и характеризующаяся тем, что в ней длина вектора определяется элементами главной диагонали, а углы между векторами — остальными элементами корреляционной матрицы. Коэффициент надежности теста. Корреляция между результата- ми двух последовательных исследований с использованием данного теста, выполненных с определенным временным интервалом, или меж- ду результатами двух тестов, применявшихся параллельно. Матрица V. Так обозначается всякая факторная матрица в процес- се вращения. Индекс при символе V, например V2>yKa3bIBaeT на число осуществленных вращений. Поэтому Vo обозначает первоначальную матрицу. Матрица остатков. Матрица, полученная из редуцированной кор- реляционной матрицы в результате элиминирования влияний последо- вательно выделяемых факторов. Матрица произведения. Матрица, элементами которой являются произведения факторных нагрузок для данной совокупности перемен- ных. Матрица трансформации. Матрица косинусов углов между ося- ми системы координат в исходном и измененном положениях, полу- ченная в процессе вращения для преобразования факторной матрицы. ^-матрица. Матрица косинусов, используемая в процессе вращения. Метод вращения. Процедура вращения осей системы координат и их гиперплоскостей, осуществляемая таким образом, чтобы макси- мальное число точек, соответствующих концам векторов, находилось на гиперплоскостях. Факторное решение. Система факторов, характерная для данной конфигурации переменных при определении положения осей системы координат. Метод вращения в одной плоскости. Метод вращения, в котором определяется одна гиперплоскость и ее вектор отсчета перед переме- щением каких-либо других векторов отсчета. Метод вращения при помощи графиков проекций. Метод вращения, в котором используются части общей схемы, состоящие из двумерных рисунков, для облегчения определения подходящей гиперплоскости для каждого следующего фактора. Метод главных осей. Метод факторного анализа, предложенный 177
Хотеллингом и Келли и определяющий факторы, которые объясняют максимальную область дисперсии и дают минимальные остатки в кор- реляционной матрице. Метод максимального правдоподобия в факторном анализе. Метод, разработанный Лоули и Янгом и приводящий к факторной матрице, наиболее точно подобранной к данной совокупности факторов. Метод основывается на принципе максимального правдоподобия Фишера. Направляющий косинус. Косинус угла, определяющего положение вектора относительно системы координат. Непостоянные ошибки. Ошибки, по-разному проявляющиеся в раз- ных объектах наблюдения. Нормализация. Деление каждого числа данной совокупности на корень квадратный из суммы квадратов всех чисел совокупности. В ре- зультате сумма квадратов полученных чисел будет равна единице. Нормативные единицы оценки. Способ выражения необработанных оценок с учетом всех оценок, приписанных всем единицам данной вы- борки, например при помощи процентиля. Обращение. Изменение алгебраических знаков всех элементов, от- носящихся к данной переменной в матрице. Это означает, что направле- ние изменений стало противоположным. Например, переменная «мо- торная ловкость» превратилась в «моторную неловкость». Обратная матрица. Матрица, обозначаемая каким-нибудь симво- лом, со степенью, равной — 1, например 7И-1. Связь ее с матрицей М выражается в том, что как (/И-1)хЛ1, так и (7И)х(/И-1) равна единич- ной матрице. Общность (communality). Сумма квадратов факторных нагрузок всех ортогональных общих факторов для данной переменной. Другими сло- вами, это общее изменение данной переменной, обусловленное факто- рами, общими для этой и других переменных совокупности. Общий (common) фактор. Фактор, соответствующий по крайней мере двум элементам данного множества переменных. Однополярный фактор. Фактор, имеющий только положительные или только отрицательные нагрузки. Ортогональный фактор. Ось системы координат, представляющая фактор, перпендикулярный оси другого фактора. Ошибка измерения. Ошибка, происходящая как по вине исследова- теля и из-за несовершенства инструмента измерения, так и по вине об- следуемого1. Сюда относятся и неточные или ошибочные наблюдения, неправильная или необоснованная интерпретация реакции обследуе- мого, плохо сформулированные инструкции и вопросы, вызывающие неоднозначные и неадекватные ответы, несоблюдение инструкции об- следуемым и т. п. Ошибка, обусловленная выборкой. Выборка из совокупности каких- либо элементов имеет среднюю и стандартное отклонение, отличаю- 1 Здесь имеются в виду ошибки измерения, связанные с использованием тес- тов и анкет. В других случаях источником ошибок измерения является ненадеж- ная статистика, различия в содержании измеряемого показателя от объекта к объекту и др. — Прим. ред. 178
щиеся, вообще говоря, от средней и стандартного отклонения генераль- ной, или «идеальной», совокупности. Первоначальная факторная матрица. Матрица, на основе которой осуществляется первое вращение к простой структуре. Переменная. Величина, принимающая различные значения в ходе данного процесса. Полная матрица корреляций. Табличная запись коэффициентов корреляции гтп, где т и п являются одновременно показателями поло- жения элементов матрицы в ее строках и столбцах, а элементы главной диагонали представлены единицами. В случае квадратной матрицы для каждой пары показателей (пт) гтп = гпт. Порядок матрицы. Количественная характеристика матрицы, учи- тывающая число строк и столбцов. Если матрица имеет т строк и п столбцов, то ее порядок — т -п, если п = т, порядок матрицы равен п. Простая структура. Такое положение осей факторов и их гипер- плоскостей, при котором максимально возможное число точек, соответ- ствующих концам векторов, находится в соответствующих гипер- плоскостях. Пространство общих факторов, m-мерное пространство, где т — число общих факторов, полученных в результате анализа совокупности п переменных (т п). Пространство тестов, (п + т)-мерное пространство, где п — число специфичных факторов у всех п тестов, а т — число общих факторов. Процедурные ошибки. Ошибки, возникающие при определении общ- ности при использовании корреляций, опирающихся частично на не- точные измерения, а также ошибки, обусловленные рассмотрением слишком малого числа факторов и неточностями в процессе вычисле- ния. Ранг матрицы. Наибольшее число линейно независимых строк или столбцов. Редуцированная корреляционная матрица. Матрица корреляций, в которой элементами главной диагонали являются общности. Связка (cluster). Матрица, как правило, меньшая исходной матрицы и включающая переменные (или переменные с обратным знаком), ха- рактеризующиеся большой корреляцией. Созвездие точек (constellation of points). Общее размещение фактор- ных нагрузок среди всех рассчитанных факторов. Специфичный (specific) фактор. Фактор, соответствующий лишь одному элементу данного множества переменных. Стандартное отклонение. Корень квадратный из дисперсии. Транспонированная матрица. Матрица, строки которой являются столбцами исходной матрицы. Транспонированный факторный анализ. Анализ матрицы корреля- ций, рассчитанных путем корреляции строк, а не столбцов матрицы оценок. Поэтому техника Q является транспонированной формой тех- ники /?, а техника О — техники Р. Уравнение тетрады. Использованная Спирмэном группировка 4 179
коэффициентов корреляции. Если разность произведений, входящих в эту группировку коэффициентов, близка к нулю, то это служит кри- терием теории «двух факторов» Спирмэна. Факторная матрица. Матрица, элементами которой являются фак- торные нагрузки, рассчитанные в процессе факторного анализа. Обыч- но эта матрица имеет столько столбцов, сколько было выделено факто- ров, и столько строк, сколько было переменных в исходной совокуп- ности. Факторная нагрузка. Корень из той части дисперсии переменной, которая обусловливается данным фактором. Корреляция между пере- менной и фактором. Факторы второго порядка. Факторы, определяемые на основе сово- купности коррелирующих друг с другом факторов первого порядка. Факторы первого порядка. Факторы, определяемые на основе мно- жества исходных переменных, полученных путем наблюдений или из- мерений. Центроид. Центральная точка, центр тяжести конфигурации век- торов, через который проходит центроидная ось. Для двумерного случая первая центроидная ось проходит через центроид таким обра- зом, что сумма положительных проекций векторов тестов на другую центроидную ось, перпендикулярную к первой, равна сумме отрица- тельных проекций на эту ось. Центроидный метод определения факторов. Метод выделения фак- торов, в котором каждая матрица остатков перед изменением знаков переменных на противоположный дает нулевую сумму всех входящих в нее переменных. Элемент матрицы. Число на пересечении строки и столбца.
ПРИЛОЖЕНИЕ К РУССКОМУ ИЗДАНИЮ Жан-Пьер Балладур ФАКТОРНЫЙ АНАЛИЗ СООТВЕТСТВИЙ 1 ВВЕДЕНИЕ Существует много методов анализа исходных данных. Такие методы, как простая линейная регрессионная модель или анализ дисперсий и ковариаций, позволяют исследовать количественные переменные. Труды профессора Бензекри ввели во Франции факторный анализ соответствий, который посвящен специально изучению качественных признаков множества исходных данных и который может найти широ- кое применение как в биологии, так и в общественных науках. Цель настоящей работы состоит в изложении основ этого метода. Анализ соответствий предназначен для изучения качественных признаков и применяется к таблице смежности двух или более признаков. Рас- смотрим, например, таблицу смежности, построенную по выборке объе- ма N из самодеятельного французского населения и фиксирующую та- кие два признака: 1) социально-профессиональную категорию (десять значений, i = 1, ..., 10); 2) департамент, в котором данное лицо постоянно проживает (де- вяносто пять значений, / = 1, ..., 95). Эта таблица, состоящая из десяти строк и девяноста пяти столб- цов, задает очевидным образом число пи лиц из выборки, относящихся к категории i и проживающих в департаменте /. Относительно какой меры анализ таблицы смежности может сфор- 1 В al 1 a d иг J.-P. Annalyse factorielle des correspondences, Annales de 1’INSEE, №4, maj— sept., 1970. 181
мулировать утверждение о том, что два или более департамента «близ- ки» или «далеки» по социально-профессиональному распределению своего самодеятельного населения, т. е. относительно какой меры мож- но рассматривать социально-профессиональные структуры двух или более департаментов как сходные или, напротив, весьма несходные? Возникает также симметричная проблема: каким образом на основе географического распределения социально-профессиональных кате- горий можно сближать те из них, которые мало отличаются по своему географическому профилю? В случае, когда определен способ измере- ния для проблем такого рода, как рассматривать в целом соотнесение близостей в поведении различных значений одного признака (департа- мента постоянного местожительства) относительно другого признака (социально-профессиональной категории)? Анализ соответствий предлагает решение таких проблем. Для этого он вводит способ измерения (расстояние) и способ визуального рассмотрения (проекцию на пространства малых размерностей — чаще всего одномерные или двумерные). 1. ОБЩИЕ ЗАМЕЧАНИЯ Важно уже сейчас отметить, что анализ соответствий основывается на статистических распределениях значений нескольких признаков в заданной генеральной совокупности. Так, например, в случае анали- за типов покупателей автомобилей с точки зрения их социально-про- фессиональной категории нет никаких оснований полагать, что резуль- таты анализа будут идентичны для немецких и для французских поку- пателей. 2. ОБОЗНАЧЕНИЯ 2.1. Пусть имеется генеральная совокупность Q, на которой опре- делены два признака / и J, принимающие соответственно Л'Ги N зна- чений, где М и N — натуральные числа (случай непрерывно изменяю- щегося признака можно свести к предыдущему, распределив значения, которые он может принимать, по конечному числу классов). Значение признака / (соответственно J) указывается индексом i (соответственно /), меняющимся от 1 до М (соответственно N). Вероятность того, что объект из Q одновременно принимает значение i по признаку / и зна- чение j по признаку J, будет обозначаться через Pi}. В случае, когда таблица смежности строится по выборке объема Т из генеральной со- вокупности Q, под вероятностью Pi} подразумевают частоту, с которой пара (t, /’) наблюдается в выборке, т. е.: р __ г il— „ > 182
2.2. Вероятность того, что объект принимает значение i, по призна- ку I будет обозначаться через Pt (соответствующая вероятность для значения j признака J — через Р.}): Pi-SPii, P i = ^Pu, i i откуда следует, что « i 2.3. Условные вероятности будут обозначаться через Рщ и Рщ‘. Рг~ — lh P.j и Р//^Г7- 3. АКСИОМЫ И ОПРЕДЕЛЕНИЯ РАССТОЯНИЯ Два значения j и /' признака J будут рассматриваться как близкие, если переход от одного из них к другому мало влияет на распределение по множеству значений i признака /. Необходимо дать математическую формулировку этого неточного определения. Для этого мы должны ввести расстояние d (j, j') между значениями / и /' признака J. 3.1. Вообще говоря, различные значения J имеют неодинаковую важность. Например, француз значительно реже (Р .j мала) проживает в департаменте Лозер, чем в департаменте Сена (Д'.,- велика). Напро- тив, возрастные структуры их населения (распределение по /) вполне могут быть сходными. Таким образом, речь идет о создании способа измерения, при котором эти два департамента считаются близкими. Следовательно, расстояние, которым мы хотим измерить близость между двумя значениями / и /' признака J, должно удовлетворять сле- дующей аксиоме. Аксиома I. Расстояние между двумя значениями признака J долж- но быть тем меньше, чем в большей степени сходны условные вероят- ности, соответствующие этим значениям. Если двум значениям J соответствуют одни и те же условные вероят- ности по всем значениям /, то расстояние между ними будет равно нулю: Ei> Pi/i = pi/Г => d (А /') = °- Таким образом, способ измерения близости между значениями / и j' не принимает во внимание объемов подмножеств исходной выборки, соответствующих этим значениям. Как мы увидим в дальнейшем, эффект объема не устраняется из рассмотрения полностью и окончательно, он просто должен быть отделен от того, что можно назвать «эффектом структуры относительно значений /». 183
Исходя из равенства Л/ = Р-/Х^=/’./ХЛ7/. •/ мы можем сказать, что Рц} представляет собой эффект структуры и что только она учитывается при определении расстояния (в соответст- вии с аксиомой I), в то время как Р.} представляет собой эффект объема и играет примерно ту же роль, что и «веса» при исчислении сложных индексов. 3.2. Предположим теперь, что две социально-профессиональные категории «рабочих» и «служащих» имеют одинаковое распределение по типам приобретенных ими автомобилей. Тогда совершенно ясно, что при изучении покупок автомобилей в различных социально-профес- сиональных категориях должна существовать возможность перегруп- пировать две упомянутые категории (два разных значения признака /) в одну более крупную: «рабочие и служащие», и это не должно никак отразиться на близости между типами автомобилей (J) и, следователь- но, на их взаимных расстояниях (такого рода перегруппировки помо- гают уменьшить число значений, принимаемых признаком /). Это свойство формализуется во второй аксиоме, которой должно удовлетворять выбранное расстояние между значениями признака J. Аксиома II. Если два значения Г и i" признака / имеют одни и те же условные вероятности по всем значениям признака J, т. е. Vi>pi'H = Pinru они заменяются одним значением k, таким, что Vi’Phi^Pi’j +Pi"i и расстояние между любой парой j’ и j" значений J должно при этом остаться неизменным. Исходя из этих двух аксиом, мы выбираем следующую формулу расстояния: d2 U,D = 2^ (Л//-Л//')2- 3.3. Проверка выполнения аксиом. Аксиома I. Если Рг/} = Рг// для всех I, то d? (j, j') = 0, и наобо- рот, если d2 (j, j') = 0, то все квадраты в формуле расстояния равны нулю и Рщ = Pi/j- для всех i. Аксиома II. Предположим, что Ру/, - = Рц” для всех/. Покажем, что при замене i' и i" одним значением k, таким, что Pki~Pi'i Pi"j, d2 сохраняется. Запишем d2 (j, j') в виде d%(j i’A -'yp. / p” PiP_________Y-Ур, /Р,7/______ р(.рг )(p, P,r)- 184
В этой сумме изменяются только два слагаемых: рцг Pi'/i‘ ,p-i Pi-. 2 2 (PiH" РГ/»"У \ p-i p-r J ’ •/ p-r / = (Pr • + Pr- ) (= (Pr + Pi"-) \ -j r.j ,/ так как Рг. -ф Pi”.=Pk. и очевидным образом Р/7* = Рщ- = Рщ--. Эти два слагаемых заменяются выражением pk (P>/k Pl'!k 2 и расстояние сохраняется. 4. ПРЕДСТАВЛЕНИЕ ЗНАЧЕНИЙ ПРИЗНАКА J В ПРОСТРАНСТВЕ RM Речь идет о том, чтобы проанализировать эффект структуры значе- ния / независимо от эффекта объема. Для этого множеству J сопостав- ляется каноническим образом подмножество в пространстве RM. Задан- ное значение j представляется точкой Х3 с координатами: Xtj= = Рщ i = Эффект объема представляется независимым образом в виде «массы» P.i, приписываемой точке Хр Таким образом, перед нами скопление точек, каждой из которых приписана соответствующая масса, или «ве- роятность», P.j. Мы определим расстояние между двумя точками Xj и Хр таким об- разом, чтобы оно равнялось расстоянию между теми значениями при- знака J, которые представлены этими точками: с?(ХрХг) = ^±-(хи-х1Г)\ Это расстояние, определенное в векторном евклидовом пространст- ве с положительно-определенной квадратичной формой <2 = [<7мЪ где Qli р и где Ьц представляет собой символ Кронекера, равный нулю при i / и единице при i = /. Известно, что путем нормализации осей можно перейти к базису, в котором матрица, представляющая эту квадратичную форму, будет единичной. 185
В этих новых осях точка У>, представляющая значение /, имеет координаты: у a = ур~ Xii‘ Расстояние тогда задается формулой d2 (У,-, У,-) = 2 (Ун— Ун')2', * i при этом массы, приписываемые точкам У; и У/-, остаются теми же. Пространство, в котором определены эти точки, является метриче- ским. Отсюда немедленно заключаем, что аксиомы расстояния выпол- няются и для d (j, j'), определенного непосредственно на значениях признака J. 5. ПРОЕКЦИЯ ИССЛЕДУЕМОГО СКОПЛЕНИЯ ТОЧЕК НА ПРОСТРАНСТВО МАЛОЙ РАЗМЕРНОСТИ Для визуального изучения соотношений близости’между различ- ными значениями признака J необходимо спроектировать полученную совокупность точек У7-в пространстве RM на трехмерное или двумерное подпространство. Это делается с помощью метода главных компонент, который является одним из наиболее часто применяемых методов фак- торного анализа. В качестве искомого подпространства выбирается подпространство, натянутое на первые три (две) главные компоненты.
БИБЛИОГРАФИЯ БИБЛИОГРАФИЯ К ПОЛЬСКОМУ ИЗДАНИЮ 1. A d с о с к С. J. Simplified factor analysis. Occup. Psychol., bond., 1946 20, p. 188—198. 2. Adcock C. J. A re-analysis of Slaters spatial judgment research, Occup. Psychol., bond., 1948, 22, p. 213—216. 3. Adcock C. J. A factorial approach to Rorschach interpretation. J. Gen. Psychoi., 1951, 44, p. 261—272. 4. Adjutant General’s Office, Personnel Research Section, Studies in visual acuity, Washington, D. C., U. S. Government Printing Office (PRS Report No 742), p. VIH, 161. 5. A d к i n s D. C. and b у e r 1 у S. B. Factor analysis of reasoning tests, Chapel Hill, N. C., Univ, of No Caroline Press, p. 122. 6. A 1 e x a n d e r W. P. Intelligence, concrete and abstract. Britt. J. Psychol., Monogr. Suppl., 1935, 6, 19, p. 177. 7. Anas tasi A. The nature of psychological «traits», Psychol. Rev., 1948, 55, p. 127—138. 8. Andree R. V. A computational short cut in factor analysis. Psychol. Bull., 1952, 49, p. 144—147. 9. A n d r e w s T. G. A factorial analysis of responses to the comic as a study in personality, J. Gen. Psychol., 1943, 28, p. 209—224. 10. A n d r e w s T. G. Statistical studies of allergy, J. Allergy, 1943, 14, P. 322—328; 1948, 19, p. 43—46. 11. Ash P. A statistical analysis of the Navy’s method of position evaluation, Publ. Personnel Rev., 1950, 11, p. 130—138. 12. В a e h r M. E. A factorial study of temperament, «Psychometrika», 1952, 17, p. 107—126. 13. В a i r J. T. Factor analysis of clerical aptitude tests, J. Appl. Psychol., 1951, 35, p. 245—249. 14. В a 1 d w i n A. b. The study of individual personality by means of the intraindividual correlation, J. Personality, 1946, 14, p. 151—168. 15. В a n к s C. Flying ability and body—build, Brit, J. Psychol. Statist. Sect., 1948, 1, p. 107—113. 16. Banks C. Factor analysis of assessments for army recruits. Brit. J. Psy- chol. Statist, Sect.,. 1949, 2, p. 76—89. 17. Banks C. and К e i r G. A factorial analysis of items in the Bernreuter Personality Inventory, Brit. J. Psychol. Statist. Sect., 1952, 5, p. 19—30. 18. В a к a r a t M. K. A factorial study of mathematical abilities, Brit. J. Psychol. Statist Sect., 1951, 4, p. 137—156. 187
19. В a r 11 e t t M. S. The statistical conception of mental factors, Brit. J. Psychol. Statist. Sect., 1948, 1, p. 204—218. 20. В a r t 1 e t t M. S. The effect of standardization on a chi-squared appro- ximation in factor analysis. «Biometrika», 1951, XXXVIII, p. 337—344. 21. Bartlett M. S. A further note on tests of significance in factor analy- sis, Brit. J. Psych., Stat. Sect., 1951, 4, p. 1—2. 22. Bartlett M. S. Tests of, significance in factor analysis, Brit. J. Psych., Stat. Sect., 1950, 3, p. 77—85. 23. Baumgarten F. Editor. La psychotechnique dans le monde moderne, Paris 1952, Presses Universitaires de France, p. 630. 24. В e c h t о 1 d t D. C. An empirical study of the stability of a simple struc- ture multiple factor solution. Amer. Psychologist, 1949, 4, p. 352. 25. BechtoldtH. P. The use of geometrical concepts of multiple factor analysis in multiple correlation problems, Amer. Psychologist, 1949, 4, p. 246. 26. Bennett G. K. Uses and limitations of factor analysis in psychological research, в книге: Proc. E.T.S. 1949 inv. conf, on testing probl, Princetown. 1950, Educational Testing Service, p. 41—44. 27. Bernyer G. A. Un essai d'analyse factorielle des aptitudes, Annee Psychol., 1945, 41—42, p. 202—226. 28. В e г п у e r G. A. Distribution des facteurs psychologiques dans une po- pulation, Annee Psychol., 1948, 45—46, p. 16—29. 29. В 1 a c k w e 1 1 A. M. A comprehensive investigation into the factors in- volved in mathematical ability of boys and girls, Brit. J. Educ. Psychol., 1940, 10, p. 143—153, 212—222. 30. В 1 a k e у R. I. A factor analysis of a nonverbal reasoning test, Educ. Psychol. Measmt., 1941, 1, p. 180—198. 31. Bonnardel R. Evolution des liaisons entre les reussites dans les diver- ses matieres scolaires, J. Psychol. Norm. Path., 1951, 44, p. 438—471. 32. В о r d e n E. S. Factor analysis in experimental designs in clinical and social psychology, Psychol. Rev., 1943, 50, p. 415—429. 33. Brodgen H. E. and Harman H. H. An analysis of factors in physical proficiency, Amer. Psychologist, 1948, 3, p. 310. 34. В г у a n t N. D. and Zachert V. Factor analyses of the Airmen Clas- sification Battery with criteria for clerk-typist and radar-mechanic trade schools, USAF Hum. Resour. Res. Cent. Res. Bull., 1951, 51—22, p. 12. 35. Burt C. L. Correlations between persons, Brit. J. Psychol., 1937, 28, p. 59—96. 36. В u r t C. L. The factors of the mind; an introduction to factor analysis in psychology, New York, 1941, Macmillan, XIV, p. 509. 37. B'u r t C. L. Statistical problems in the evaluation of army tests, «Psycho- metrika», 1944, 9, p. 219—235. 38. В u r t C. L. Factorial analysis and physical types, «Psychometrika», 1947, 12, p. 171—188. 39. В u r t C. L. ! Factor analysis in psychological medicine, Brit. Med. Bull., 1948, 5, p. 375—376. 40. В u r t C. L. The factorial study~of temperamental traits, Brit. J. Psy- chol. Statist. Sect., 1948, 1, p. 178—203. * 41. Bur t C. L. Group factor analysis, Brit. J. Psychol. Statist., Sect., 1950, 3, p. 40—75. 42. В u r t C. L. The factorial study of emotions. В книге: Reginert M. L. (Editor), Feelings and emotions; the Mooseheart symposium, New York, Me Graw- Hill Book Co., p. 531—551. 43. Burt C. L. and Banks C. A factorial analysis of body measurements for British adult males, Ann. Eugen., Camb., 1947, 13, p. 238—256. 44. В u r t C. L. Tests of significance in factor analysis, Brit. J. Psych., Stat. Sect., 5, Part II, June 1952. 45. Burt C. L. and John E. A factorial analysis of Terman—Binet tests, Brit. J. Educ. Psychol., 1942, 12, p. 117—127, 156—161. 46. С a r 1 s о n H. B. Factor analysis of memory ability, J. Exp. Psychol., 937, 21, p. 477—192. 188
47. С а г г о 1 J. В. A factor analysis of verbal abilities, «Psychometrika», 1941, 6, p. 279—308. 48. CarrolJ. B. Problems in the factor analysis of tests of varying difficulty, Amer. Psychologist, 1950, 5, p. 369. 49. C a t t e 1 1 R. B. Personality structure and measurement. I. The oberatio- nal determination of trait unities, Brit. J. Psychol., 1946, 36, p. 88—103. 50. C a t t e 1 1 R. B. Personality structure and measurement. II. The deter- mination and utility of trait modality, Brit. J. Psychol., 1946, 36, p. 159—174. 51. C a t t e 1 1 R. B. Description and measurement of personality, N. Y. 1946, World Book Co., p. 602. 52. C a t t e 1 1 R. B. Personality factors in women, Brit. J. Psychol. Statist. Sect., 1948, 1, p. 102—120. 53. C a t t e 1 1 R. B. The integration of factor analysis with psychology, a reply to Professor Godfrey Thomson's review of «The description and measurement of perso- nality», J. Educ. Psychol., 1948, 39, p. 227—236. 54. C a t t e 1 1 R. B. Personality, a systematic, theoretical and factual study, New York 1950, Me. Graw-Hill Book Co., p. 689. 55. C a t t e 1 1 R. B. On the disuse and misuse of P, Q, R and О techniques in clinical psychology, J. Clin. Psychol., 1951, 7, p. 203—214. 56. C a t t e 1 1 R. B. Factor analysis', an introduction and manual for the psychologist and social scientist, New York 1952, Harper and Bros., p. XIII, 462. 57. C a t t e 1 1 R. B. P-technique factorization; в книге: Brower and Abt, Progress in clinical psychology, p. 536—544. 58. C a t t e 1 1 R. B. and Adelson M. The dimensions of social change in the U.S.A, as determined by P-technique, «Social Forces», 1951, 30, p. 190—201. 59. Cattell R. B. and Saunders D. B. Inter-relation and matching of personality factors from behavior rating, questionnaire, and objective test data, J. Soc. Psychol., 1950, 31, p. 243—260. 60. C h a p m a n R. L. The Mac Quarrie test for mechanical ability, «Psycho- metrika», 1948, 13, p. 175—179. 61. C h e n T. L. and Chow H. A factor study of a test battery at different educational levels, J. Genet, Psychol., 1948, 73, p. 187—199. 62. С 1 a r k M. P. Changes in primary mental abilities with age, Arch. Psy- chol., 1944, No 291, p. 30. 63. Cohen J. Colour vision and factor analysis, Psychol. Rev. 1949, 56, p. 224—233. 64. Coombs С. H. A factorial study of number ability, «Psychometrika», 1941, 6, p. 161—189. 65. Cottle W. C. A factorial study of the Multiphasic, Strong, Ruder and Bell Inventories using a population of adult males, «Psychometrika», 1950, 15, p. 25— 47. 66. С о x J. A. Jr. A factor analysis af Airman Classification Battery test sco- res for Airplane Sheetmetal Worker technical school graduates, H.R.R.C. Research Note Pers., p. 51. 67. Cox S. M. A factorial stud of the Rorschach responses of normal and ma- ladjusted boys, J. Genet. Psychol., 1951, 79, p. 95—115. 68. C u r e t о п E. E. The verbal relations factor and vocabulary, Amer. Psychologist, 1947, 2, p. 286—287. 69. D ar m о i s M. G. L'analyse des correlations, Paris 1949, Universite de Paris, p. 20. 70. Davidson W. M. and С a г г о 1 1 J. Speed and level components in time-limit scores', a factor analysis, Educ. Psychol. Measmt., 1945, 5, p. 411—427. 71. Delaporte P. Verification de I'efficacite d'une methode d'analyse fac- torielle, C. R. Acad. Sci. Paris, 1945, 220, p. 212—214. 72. D r e w L. J. An investigation into the measurement of technical ability, Occup. Psychol., Lond., 1947, 21, p. 34—38. 73. Dwyer P. S. Linear computations, New York, 1951, John Wiley and Sons., Inc. 74. Emmett W. G. Factor analysis by Lawley’s~method of maximum like- lihood, Brit. J. Psychol. Statist Sect., 1949, 2, p. 20—97. 189
75. E n g 1 i s h H. B. Factor analysis explained (without mathematics), Egypt J. Psychol., 1948, 3, p. 475—484. 76. Eysenck H. J. The general factor in aesthetic judgments, Brit. J. Psy- chol., 1940, 31, p. 94—102. 77. Eysenck H. J. The appreciation of humor, an experimental and theo- retical study, Brit. J. Psychol., 1942, 32, p. 295—309. 78. Eysenck H. J. Dimensions of personality. New York, 1949, The Mac- millan Co., p. 308. 79. Eysenck H. J. Uses and limitations of factor analysis in psychological research, в книге: Proc. E.T.S. 1949 inv. conf,, on testing probl.. Princetown, i960, Educational Testing Service, p. 45—49. 80. Eysenck H. J. The scientific study of personality, London 1952, Rout- ledge and Kegan Paul, p. 320. 81. Eysenck H. J. The structure of human personality, London, 1953, Methuen. 82. F e r g u s о n G. A. A bi-factor analysis of reliability coefficients, Brit J., Psychol., 1940, 31, p. 172—182. 83. F 1 о о d M. M. A computational procedure for the method of principal com- ponents, «Psychometrika» 1940, 5, p. 169—172. 84. F r u c ht e r B. Introduction to factor analysis, New-York, 1954, D. Van Nostrand Co., p. XII, 280. 85. G i’b’s on W. A. Orthogonal and oblique simple structure, «Psychometri- ka», 1952, 17, p. 317—324. 86. G i r a u 1 t M. Sur la notion de facteur commun en analyse factorielle ge- nerate, C. R. Acad. Sci. Paris, 1948, 227, p. 499—500. 87. G о о d m а п С. H. A factorial analysis of Thurstone's seven primary abi- lities, «Psychometrika», 1943, 8, p. 121—129. 88. Gordon O. J. A factor analysis of human needs and industrial morale, 1952, Thesis, Univ, ol Utah. 89. G о u r 1 a у N. Difficulty factors arising from the use of tetrachoric cor- relations in factor analysis, Brit. J. Psychol. Statist. Sect., 1951, 4, p. 65—76. 90. Guertin W. H. A factor analysis of some Szondi pictures, J. Clin. Psychol., 1951, 7, p. 232—235. 91. Guilford J. P. Psychometric Methods, New York, 1936, Me Graw- Hill Book Co., p. XVI, 566. 92. Guilford J. P. A note on the discovery of a G-factor by means of, Thurs- tone’s centroid method of analysis, «Psychometrika», 1941, 6, p. 205—208. 93. Guilford J. P. The discovery of atitude and achivement variables, «Science», 1947, 106, p. 279—282. 94. Guilford J. P. Some lessons from aviation psychology, Amer. Psycho- logist, 1948, 3, p. 3—11. 95. Guilford J. P. Fruchter B. and Zimmerman W. Factor analysis of the Army Air Forces Sheppard Field Battery of experimental aptitude! tests, «Psychometrika», 1952, 17, p. 45—68. 96. Guttman L. Multiple group methods for common-factor analysis’, their basis, computation, and interpretation, «Psychometrika», 1952, 17, p. 209—222. 97. Guttmann L. A new approach to factor analysis, в книге: P. F. L a- z a r s f e 1 d (Editor) Mathematical Thinking in the Social Sciences, New York, 1954, Columbia LTniv. Press. 98. Halstead W. C. Brain and intelligence’, a quantitative study of the frontal lobes, Chicago, 1947, Univ, of Chicago Press, p. 206. 99. H a m m о n d W. H. Factor analysis as applied to social and economic data, Brit. J. Psychol., 1946, 16, p. 178. 100. Harper R. ef al. The application of multiple factor analysis to industri- al test data, Brit. J. Appl. Phys. 1950, 1, p. 1—6. 101. Harris C. W. Direct rotation to primary structure, J. Educ. Psychol., 1948, 39, p. 449—468. 102. H о 1 1 e у J. W. A note on the reflection of signs in the extraction ob cent- roid factors, «Psychometrika», 1947, 12, p. 263—265. 190
103. Holzinger К. J- The relationship between the centroid and Spear- man's methods, J. Educ. Psychol., 1944, 35, p. 347—351. 104. Holzinger K. J. Interpretationof second-order factors, «Psychometri- ka», 1945, 10, p. 21—25. 105. Holzinger K- J- and Harman H. H. Factor analysis: a synthesis of factorial methods, Chicago 1941, Univ, of Chicago Press, p. XII, 417. 106. Holzinger K. J. and H a r m a n H. H. Factoring factors, J. Educ. Psychol., 1947, 38, p. 321—328. 107. Horst P. Uses and limitations of factor analysis in psychological rese- arch, в книге: Proc. E.T.S. 1949 inv. conf, on testing probl. Princetown, 1950, Educational Testing Service, p. 50—56. 108. Hotelling H. Analysis of a complex of statistical variables into prin- cipal components, Baltimore, 1953, Warwick and York, p. 48. 109. Hotelling H. Simplified calculation of principal components, «Psy- chometrika», 1935, 1, p. 27—35. 110. Hsii E. H. A factorial analysis of olfaction, «Psychometrika», 1946, 11, p. 31—42. 111. H s fl E. H. The Rorschach responses and factor analysis, J. Gen. Psychol., 1947, 37, p. 129—138. 112. H s fl E. H. and Sherman M. The factorial analysis of the electro- encephalogram, J. Psychol., 1946, 21, p. 189—196. 113. H u m p h г e у s L. C. Measures of strength of conditioned eyelid res- ponses, J. Gen. Psychol., 1943, 29, p. 101—111. 114. J a s p e n N. A factor study of worker characteristics, J. Appl. Psychol., 1949, 33, p. 449—459. 115. J о h n s о n D. M. and Reynolds F., A factor analysis of verbal ability, Psychol. Rev. 1941, 4, p. 183—195. 116. J о n e s F. N. A factor analysis of visibility data, Amer. J. Psychol., 1948, 61, p. 361—369. 117. Karlin J. E. Factor analysis in the field of music, J. Musical., 1941, 3, p. 41—52. 118. К e i r G. The progressive matrices as applied to school children, Brit. J. Psychol. Statist. Sect., 1949, 2, p. 140—150. 119. К e 1 1 e у T. L. A variance — ratio test of the uniqueness of principal— axis components as they exist at any stage of the Kelley iterative process for their deter- mination, «Psychometrika», 1944, 9, p. 199—200. 120. Kemptho.ne O. The factorial approach to the weighting problem, Ann. Math. Statist., 1948, 19, p. 238—245. 121. Kendall M. G. Factor analysis, J. Roy. Statist. Soc. 1950, 12, p. 60—73. 122. Kendall M. G. Factor analysis as a statistical technique, J. Roy. Stat. Soc., 1950, B. 12, p. 60—94. 123. Kendall M. G. Regression, structure and factorial relationship, «Bio- metrika», 1951, XXXVIII, p. 11—25. 124. Kestelman H. The fundamental equation of factor analysis, Brit. J. Psychol. Statist. Sect., 1952, 5, p. 1—6. 125. L a n d a h 1 H. D. Time scores and factor analysis, «Psychometrika», 1940, 5. p. 67—74. 126. Laurier B. Analyse factor ielle des traits de caractere et des aptitudes du maitre ideal. Bull. Canad. Psychol. Ass., 1945, 5, p. 77—78. 127. Lawley D. N. The estimation of factor loadings by the method of ma- ximum likelihood. Proc, of the Royal Society of Edinburgh, 1940, 60, p. 64—82. 128. Lawley D. N. The application of the maximum likelihood method to factor analysis, Brit. J. Psychol., 1913, 33, p. 172—175. 129. Lawley D. N. Factor analysis by maximum likelihood: a correction, Brit. J. Psychol. Statist. Sect., 1950, 3, p. 76. 130. L a w s h e С. H. Jr. and W i 1 s о n R. F. Studies in fob evaluation, 5. An analysis of the factor comparison system as it functions in a paper mill, J. Appl. Psychol., 1946, 30, p. 426—434. 191
131. L a w s h е С. H. Jr., D u d e к E. E. and Wilson R. F. Studies of job evaluation. 7. A [actor analysis of two point rating methods of job evaluation, J. Appl. Psychol., 1948, 32, p. 118—129. ,< . 132. L a z a r s f e 1 d P. F. Factor analysis 57 qualitative attributes, Amer. Psychologist, 1947, 2, p. 306. 133. Lodge G. T. Correlates of criminal behavior. J. Soc. Psychol., 1947, 25, p. 3—51. 134, Lorr M. A factorial isolation of two social attitudes, J. Soc. Psychol., 1951, 34, p. 139—142. 135. Lovell C. A study of, the factor structure of thirteen personality variab- les, Educ. Psychol. Measmt., 1945, 5, p. 335—350. , - 136. Luborsky L. B. and Hornaday [J. АЛЛ mechanical [actor- rotator for demonstration, Amer. J. Psychol., 1948, 61, p. 104—106. 137. Mac Duffee C.^C. Vectors and matrices, Mathematical Association of America, New York, 1943 p. 192. 138. Martin G. C. A factorial analysis of the Bernreuter Personality In- ventory, Educ. Psychol. Measmt., 1948, 8, p. 85—92. 139. Me Cloy С. H. The measurement of speed in motor performance, «Psy- chometrika», 1940, 5, p. 173—182. 140. M. Craw L. W. A factor analysis of motor learning, Res. Quart. Amer. Ass. Hlth., 1949, 20, p. 316—335. 141. Me N emar Q. On the number of factors, «Psychometrika», 1942, 7, p. 9—18. 142. Me d 1 an d F. F. An empirical comparison of methods of communality estimation, «Psychometrika», 1947, 12, p. 101—109. 143. Meili R. L' analyse de Г intelligence. Arch. Psychol., Geneve 1946, 31, p. 1—64. 144. Meili R. Die Faktorentheorie von Charles Edward Spearman (1863— 1945), Schweiz. Z. Psychol. Anwend., 1947, 6, S. 137—140. 145. Meili R. Faktorielle Analyse der praktischen Intelligenz", в книге: F. Baumgarten (1952) (Editor), s. 484—485. 146. M i c h a e 1 W. B. Factor analyses of tests and criteria', a comparative study of two AAF pilot populations, Psychol. Monogr. 1949, 63, (3), (No. 298), p. v, 55. 147. Michael W. B. The nature of space and visualization abilities: some recent findings based on factor analysis studies, Trans. N. Y. Acad. Sci., 1949, 11.. p. 275—281. 148. Moore T. V. and Hsu E. H. Factorial analysis of anthropological measurements in psychotic patients, Hum. Biol., 1946, 18, p. 133—157. 149. Myers С. T. The factorial composition and validity of differently spe- eded tests, «Psychometrika», 1952, 17, p. 347—352. \ 150. N о r t h R. D. Jr. Analysis of the personality dimensions of introver- sion— extraversion, J. Personality, 1949, 17, p. 352—367. 151. Окоп J. Analiza czynnikowa eksperymentalnych testiw zastosowanych w szkolnictwie zawodowym Przemyslu W^glowego. «Biuletyn Instytutu W^glowego», Komunikat Nr 64, Katowice 1949, str. 39. 152. Peatman J. G. Descriptive and sampling statistics, New York, 1947, Harper and Brothers, p. 577. 153. Perlis S. Theory of Matrices, Cambridge, 1952, Addison — Wesley. 154. Pid dington L. S. A factorialstudy of types of fear, Brit. J. Psychol.,. 1941, 11, p. 227. 155. Price E. J. J. The nature of the practical factor (F), Brit. J. Psychol., 1940, 30, p. 341—351. 156. Puranen E., F aktorstrukturen av nagra verbila tests, Nord. Psychol., 1951, 3, S. 33—45. 157. Rao C. Radhakrishna. Estimation and tests of significance in [actor analysis, «Psychometrika», 20, June 1955, No 2. 158. R e e s L. Л factorial study of physical constitution in women, J. Ment. Sci., 1950, 46, p. 619—632. 159. Renshaw T. Factor rotation by the method of extended vectors. A re- view of Dr Sutherlands paper, Brit. J. Psychol. Statist. Sect., 1952, 5, p. 7—18. 192
160. Reyburn H. A. and R a a I h M. J. Simple structure: a critical examination, Brit. J. Psychol., 1949, 2, p. 125—133. 161. Reyburn H. A. and Taylor J. G. Factors in introversion and extraversion. Brit. J. Psychol., 1941, 31, p. 335—340. 162. Richardson L. F. A method for computing principal axes, Brit. J. Psychol. Statist. Sect., 1950, 3, p. 16—20. 163. R i p p e D а у 1 e D. Application of a large sampling criterion to some sampling problems in [actor analysis, «Psychometrika», 1953, 16, No 3. 164. Royce J. R. The factorial analysis of animal behavior, Psychol. Bull., 1950, 47, p. 235—259. 165. Ryans D. G. A study of, criterion data: a factor analysis of teacher be- haviors in the elementary school, Educ. Psychol. Measmt., 1952, 12, p. 333—344. 166. S a n a i M. A factorial study of social attitudes, J. Soc. Psychol., 1950, 31, p. 167—182. 167. Sanai M. An experimental study of social attitudes, J. Soc. Psychol., 1951, 34, p. 235—264. 168. Saunders D. R. Factor analysis I: some effects of chance error, «Psy- chometrika», 1948, 13, p. 251—257. 169. Saunders D. R. Factor analysis II: a note concerning rotation of axes to simple structure, Educ. Psychol. Measmt., 1949, 9, p. 753—756. 170. Seashore R. H. An experimental and theoretical analysis of fine motor skills, Amer. J. Psychol., 1940, 53, p. 86—98. 171. Seashore. R. H. and D u d e к F. J. A factorial analysis of preci- sion, steadiness, and equilibrium in fine motor skills, Amer. Psychologist, 1950, 5, p. 276—277. 172. Sheldon W. H. and Stevens S. S. The varieties of temperament', a psychology of constitutional differences, New Jork 1942, Harper and Bros., p. X, 520. 173. S к a r d Q.- Oversikt over test — psychologiens utvikling: intelligensteorier, factor-analytiske teorier, Oslo, Universitetets Studentkontor, s. 58. 174. Spearman C. General intelligence objectively determined and measu- red, Amer, J. Psychol., 1904, 15, p. 201—293. 175. Spearman C. The abilities of man, London 1927, Macmillan. 176. Spearman C. Theory of general factor, Brit. J. Psychol., 1946, 36, p. 117—131. 177. Spearman C. and Jones L. W. Human Ability, London 1950, Macmillan, p. VII, 198. 178. Staff, Division of Occupational Analysis, War Manpower Commision, Factor analysis of occupational aptitude tests, Educ, psychol. Measmt., 1945, 5, p. 147—155. 179. Stagner R. and Katzoff E. T. Fascist attitudes: factor analysis of item correlations, J. Soc. Psychol., 1942, 16, p. 3—9. 180. Stephenson W. A statistical approach to typology: the study of trait universes, J. Clin. Psychol., 1950, 6, p. 26—38. 181. Stephenson W. The significance of Q-technique for the study of per- sonality: в книге: Regnert M. L. (Editor) Feelings and Emotions: the Mooseheart symposium, New York 1950, Me Graw — Hill Book Co., p. 552—570. 182. Stephenson W. Q-methodology and the projective techniques, J. Clin. Psychol., 1952, 8, p. 219—229. 183. Strong E. K. Vocational interests of men and women, Standford Univ. Press, 1943, p. 746. 184. S w i n e f о r d F. Some comparisons of the multi pie-factor and the bi- factor methods of analysis, «Psychometrika», 1941, 6, p. 375—382. 185. Swineford F. A study in factor analysis: the nature of the general, verbal, and spatial bi-factors. Suppl. educ. Monogr., No 67, p. XI, 70. 186. Swineford F. A number factor, J. educ. Psychol., 1949, 40, p. 157—167. 187. Thomson D. F. A treatment of industrial attitude data by means of factor analysis. Ph. D., Ohio State Univ., 1948. 188. Thomson G. H. A hierarchy without a general factor, Brit. J. Psychol., 1916, 8, p. 271—281. 193
189. T h о m s о n G. Н. An analysis of performance test scores of a representa- tive group of Scottish children, London 1940, Univ, of London Press, p. Б8. 190. Thomson G, H. Some recent work in factorial analysis, and a retro- spect, Presidential address to British Psychological Society, London 1946, Univ. London Press, p. 16. 191. Thomson G. H. L' analyse factorielle des aptitudes humaines, Paris 1950, Presses Universitaires de France, p. IX, 421. 192. Thomson G. The factorial analysis of human ability, (5 ed.) Boston 1951, Houghton-Mifflin Co., p. 383. ~~ 193. Thorndike R. L. Factors determining errors of navigational posi- tion: в книге: Kelly G. A. New Methods in Applied Psychology, College Park, Md. 1947, Univ. Md., p. 194—198. 194. Thorndike R. L. Individual differences, Annual Rev. Psychol., 1950, 1, p. 87—104. 195. Thurston e jL. L. Vectors of Mind, Chicago 1935, Univ, of Chicago Press. 196. Thurstone L. L. Current misuse of the factorial methods, «Psycho- metrika», 1937, 2, p. 73—76. 197. Thurstone L. L. Primary mental abilities, Psychometric Monogr., No. 1, 1938, IX, p. 121. 198. Thurstone L. L. Graphical method of factoring the correlational matrix. Proc. Nat. Acad. Sci., Wash., 1944, 30, p. 129—134. 199. T h u r s t о n e L. L. A factorial study of perception, Psychometric Monogr., 1944, No 4, p. 148. - 200. Thurstone L. L. The effects of selection in factor analysis, «Psycho- metrika», 1945, 10, p. 165—198. 201. Thurstone L. L. Factorial analysis of body measurements, Amer. J. Phys. Anthrop., 1947, 5, p. 15—28. 202. Thurstone L. L. Prymary abilities', в книге: Harriman P. W. Encyclopedia Psychol., New York, Philosophical Library, p. 544—546. 203. Thurstone L. L. Multiple factor analysis: a development and expan- sion of the vectors of mind, Chicago 1947, Univ, of Chicago Press, p. 535. 204. Thurstone L. L. An analysis of mechanical aptitude, Psychomet- ric Lab. Report No 62, Univ. Chicago, 1951, p. 26. 205. Thurstone L. L. Factor analysis as a scientific method, Psychome- tric Lab. Report No 65, Univ. Chicago. 1951, p. 7. 206. Thurstone L. L. L'analyse factorielle, methode scientifique, Annee Psychol., 1951, 50, p. 61—75. 207. Thurstone L. L. and Thurstone T. G. Factorial studies of intelligence, Psychometric Monogr., 1941, No 2, p. 94. 208. Tryon R. C. Cluster analysis: correlation profile and orthometric (fac- tor) analysis for the isolation of unities in mind and personality, Ann. Arbor 1939, Edwards Bros, p. 122. 209. Tucker L. R. The role of correlated factors in factor analysis. «Psycho- metrika», 1940, 5, p. 141—152. 210. T u c k e r L. R. The determination of successive principal components without computation of tables of residual correlation coefficients, «Psychometrika», 1944, 9, p. 149-153. 211. Vernon P. E An analysis of the concention of morale, «Character and Personality», 1941, 9, p. 283—294. 212. Vernon P. E. The structure of practical abilities, Occup. Psychol., Lond., 1949, 23, p. 81—96. 213. Vernon P. E. The structure of human abilities. New York 1951, 'John Wiley and Sons, p. 160. 214. Wade T. L. The Algebra of Vectors and Matrices, Cambridge 1952, Addison Wesley. 215. Weinberg D. Une experience de controle des methodes d'analyse facto- rielle, C. R. Acad. Sci. Paris 1945, 220, p. 214—216. 216. Whirry R. J. A factorial study of visual acuity, depth, and phoria measurements with three commercial screening devices, Amer. Psychologist, 1947, 2. 194
217. Winn e J. F. Common and unique [actor patterns in normals and neu- rotics, Amer. Psychologist, 1950, 5, p. 325. 218. Wittenborn J. R. Mechanical ability, its nature and measurement. I. An analysis of, the variables employed in the preliminary Minnesota experiment. II. Manual dexterity, Educ. Psychol. Measmt., 1945, 5, p. 241—260, 395—409. 219. W о 1 f 1 e D. Factor analysis to 1940, Psychometric Monogr., 1940, No.3, p. 69. 220. Woodrow H. The relation between abilities and improvement with practice, J. Educ. Psychol., 1938, 29, p. 215—230. 221. Y e 1 a M. La technica del analisis factorial, Rev. Psicol. Gen. Apl., Mad- rid 1949, 4, p. 121—140, 317—324, 763—780. 222. Young G. Maximum likelihood estimation and factor analysis, «Psy- chometrika», 1941, 6, p. 49—53. 223. ZachertV. A factor analysis of vision tests, Amer. J. Op tom, 1951, 28, p. 405—416. 224. Zachert V. Factor analysis of the Army, Navy and Air Force classi- fication batteries, H.R.R.C. Research Bulletin, 1952, p. 52—12. 225. Zimmerman W. S. A simple graphical method for ortogonal rota- tion of axes, «Psychometrika», 1946, 11, p. 51—55. ДОПОЛНЕНИЕ К СПИСКУ ЛИТЕРАТУРЫ Вопросы методики 226. Андерсон Т. Введение в многомерный статистический анализ. М., Физматгиз, 1963. Anderson Т. W. An introduction to multivariate sta- tistical analysis. New York: John Wiley and Sons, Inc., 1958. 227. Аркадьев А. Г., Браверман Э. M. Обучение машин клас- сификации объектов. М., «Наука», 1971. 228. Браверман Э. М. Методы экстремальной группировки парамет- ров и задача выделения существенных факторов. — «Автоматика и телемеханика», 1970, № 1. 229. Браверман Э. М., Д о р о ф е ю к А. А., ЛумельскийВ. Я., Мучник И. Б. Методы диагонализации матриц связи. Труды Института проб- лем управления. Вып. 1, М., 1971. 230. Дорофеюк А. А. Автоматическая классификация (обзор). Труды Института проблем управления. Вып. 1. М., 1971. 231. Л о у л и Д., Максвелл А. Факторный анализ как статистиче- ский метод. М., «Мир», 1967. Lawley D. N. and Maxwell А. Е. [Factor analysis as a statistical method. London: Butterforth, 1963. 232. Л у м e л ь с к и й В. Я- Группировка параметров на основе квад- ратной матрицы связи. — «Автоматика и телемеханика», 1970, № 1. 233. Налимов В. В. Теория эксперимента, М., «Наука», 1971. 234. Харман Г. Современный факторный анализ. М., «Статистика», 1972. Harman Н. Н. Modern factor analysis. Chicago and London: The Uni- versity of Chicago press, 2ed. 1967, 2imp. 1968. ПРИЛОЖЕНИЯ ФАКТОРНОГО АНАЛИЗА 235. Андрукович П. Ф. Применение метода главных компонент в прак- тических исследованиях. Труды Межфакультетской лаборатории статистических методов. Вып. 36, МГУ. М., 1973. 236. Докторов Б. 3. Об использовании методов факторного анализа в работах советских исследователей (обзор). — «Вопросы психологии», 1969, № 2. 195
237. Жуковская В. М., Кузина И. М. Типологическое изуче- ние сельского хозяйства США и Канады с использованием методов многофактор- ного анализа. — В сб.: Вопросы экономической и политической географии за- рубежных стран. М. 1971. 238. 3 а с ла в с к а я Т. И., Виноградова К. В. Факторный анализ причин миграции сельского населения. — В сб.: Социология и математика. Новосибирск, 1970. 239. Максимов Г. Т., Сидоров П. А. Роль миграции в измене- нии численности городского населения БССР. Опыт расчета на ЭВМ «Минск-2» по алгоритму и программе факторного анализа. Минск, 1966. 240. Мацегорин И. В., Румянцев В. Ф. Факторный анализ ме- ханических характеристик стали. — «Заводская лаборатория», т. 36, № 1, 1970. 241. Многомерные классификации в социально-экономических исследова- ниях. Использование методов факторного анализа и распознавания образов. Сборник статей. М., ИМЭМО, 1973. 242. Применение электронно-вычислительной техники в науке о спорте (ки- бернетика и спорт). Тезисы докладов, М., 1968. 243. Социология и математика. Международный сборник. Новосибирск, 244. Типологические особенности нервной деятельности человека. Сборник статей, т. IV. М., «Просвещение», 1967.
предметный указатель Анализ многофакторный 42, 130 Анализа многофакторного цель 41 Анализ факторный как метод 10, 16, 24 Вектор единичный 53, 56 — отсчета 56 — теста 52 Вектора абсолютная мера 52 Векторов конфигурация 55 — связка 64 Величина Т 72, 89 Версор 61 Вращение косое 153 — в одной плоскости 94 — в трех плоскостях 100 — системы координат 20, 94 Вращения угол 96, 102 Вторая матрица повернутых факто- ров 105 — центроидная ось 75 Геометрическое представление 52 Гиперплоскость 98 Гиперпространство 58 Главная диагональ 30, 55, 71 Дисперсия из-за ошибки 44 — надежная 44, 47 — общая 46 — полная 44, 45 — специфическая 44 Знаки факторных нагрузок 78 Исчезновение минора 33 Классификационные тесты 119 Конфигурация векторов 55, 63, 69 Корреляция 34 Корреляции коэффициент 35 — нулевой представление 53 — отрицательной представление 53 — положительной представление 53 — связка 64 Коэффициент надежности 37 — постоянства 37 Коэффициент', теста ,45 — • эквивалентности 37 Косинус направляющий 101 Критерий Саундерса 80, 82 Критерии правильности расчетов 75, 77, 79 Линейная зависимость 33 Матрица вторых остатков 81 — вырожденная 31 — единичная 30 — • квадратная 26 — корреляций 47, 71 — А, 102 — L 159 — М 157, 171 — направляющих косинусов 101 — обратная 31 — общих факторов 93 — оценок 151 — первых остатков 77 — произведений 74 — симметрическая 28 — скалярная 30 — Sj 156 — трансформации 103, 104 — факторов до поворота 94, 100, 104 — факторов после поворота 94, 104 Матриц транспонирование 27 — умножение 28 Матрицы порядок 27 — ранг 33 — тип 27 Метод Барта 85 — биполярных факторов 134, 136 — главных осей 131 — главных элементов 133 — групп 139 • — групп многократных 83, 130 — группировки 83, 130 — двухфакторный 133 — диагональный 130 197
Метод малого центроида 85 — наибольшей корреляции 84 — наибольшего правдоподобия Лоули 133 — центра тяжести 70 Минор 32 Многофакторный анализ 42, 130 Модели трехмерные 62 Момента смешанного корреляция 35 Мотивация 166 Нагрузка второго фактора 118 — нулевая 108 — факторная 43, 54 Надежности коэффициент 37, 103 Нормаль к гиперплоскости 155 Нормализация направляющих косину- сов 94 Нулевая нагрузка фактора 107 Обращение знаков 75, 77, 88 Общности оценка 72 Общность 46 Определение второго фактора 77 — общности 83 — специфических факторных нагрузок 93 — третьего фактора 81 Определитель 31 Определителя порядок 31 Организация эксперимента 168 Оси исходные 161 Основное уравнение факторного ана- лиза 50 Остатки корреляций 73 Ось отсчета 56 — центроидная 69 Отрицательные остатки 73 Первый общий фактор 72 Переменная 34, 70 Полная матрица корреляций 48 ------ факторов 50 Положение центроидное оси системы координат 70 Порядок матрицы 26 Природа факторов 102 Пространство п-мерное 59 — общего фактора 62, 92 — тестов 62 Простая структура 96, 107, 139 Прямолинейная зависимость 35 Радиальный метод вращения 161 Размерность пространства 58 Ранг матрицы 33 — матрицы корреляций 52, 58, 129 Редуцированная матрица корреляций 48 — — векторов 50 Решение факторное 100 Связка корреляций 64 — факторных векторов 162 Система иерархическая 125 Система координат 56 •— пустых ступеней 134/136 Скалярное произведение 52 Скорость работы 165 Слепое вращение 140 Совокупность факторов до поворота 94 Сокращенный метод изменения знаков переменных 87 Специфика теста 46, 93 Специфические факторы 49, 93 Спирмэна теория 122 Стандартное отклонение 36, 51 Структура факторная 58 Тангенс угла 103 Теория двух факторов 126 — факторного анализа 139 Тест 164 Тетрады Спирмэна 125 Техника О 143 — Р 143 — Q 141 — R 141 — S 148 — Т 148 — факторного анализа 139 Трехмерная система векторов 92 Трудности теста 165 Угол вращения 96, 103 Уравнение тетрады 124 Фактор генеральный 125, 128 — групповой 127 — . общий 41, 51, 68, 128 — пространственный 116, 118 — специфичный 46, 128 — числовой 117 — g 124 — S 126 Факторы второго порядка 162 — высших порядков 162 — индивидуальных различий 120 — косые 54, 151 — ортогональные 52, 54, 151 — способностей 116, 117 — характерные 49 — центроидные 70 Факторная матрица до поворота 94, 100, 104 Факторные методы 16 Формула Спирмэна — Брауна 37 Формула Тэрстоуна 82 Центральный пункт связки векторов 70 Центроид 70 Центроидный метод определения фак- торов 67, 69, 70 Цикл вычислительных операций цент- роидного метода 110 Числа направляющие 156 Число центроидных факторов 82
ОГЛАВЛЕНИЕ Предисловие к русскому переводу............................... 5 Введение......................................................10 Глава I. Общая характеристика факторного анализа как научного метода........................................................14 Глава II. Математические основы факторного анализа .... 26 1. Матрицы и определители.................................. 26 2. Корреляция...............................................34 Глава III. Некоторые основные положения теории факторного ана- лиза .........................................................38 1. Интерпретация корреляции.................................38 2. Некоторые основные зависимости и понятия многофакторного анализа.....................................................42 3. Геометрическая интерпретация некоторых основных зависимо- стей .......................................................52 Глава IV. Центроидный метод определения факторов..............67 1. Вступительные замечания..................................67 2. Основы расчета факторных нагрузок в центроидной методе . 68 3. Происхождение названия «центроидный метод»...............69 4. Определение нагрузок первого общего фактора..............70 5. Определение нагрузок следующих факторов..................73 6. Некоторые специфические проблемы центроидного метода . . 83 Глава V. Вращение системы координат...........................90 1. Вступительные замечания..................................90 2. Простая структура........................................97 3. Процедура вращения в трехмерном случае...................99 4. Основные способы проверки правильности расчетов в процессе вращения....................................................108 Глава VI. Интерпретация факторов............................. 111 Глава VII. Другие методы определения факторов.................122 1. Вступительные замечания о путях развития факторного анализа 122 2. Многофакторный анализ и концепция Спирмэна...............128 3. Главные разновидности методов определения факторов .... 130 Глава VIII. Различные техники проведения факторного эксперимента ............................................. 139 1. Проблема тождества факторов.............................139 2. Техники R и Q..........................................141 3. Техники Р и О..........................................143 4. Сравнение техник 7?, Q, Р и О...........................145 199
Глава IX. Зависимые факторы и факторы высших порядков . . 1FQ 1. Косое вращение..........................................150 2. Факторы более высоких порядков .........................162 Глава X. Основные принципы организации исследований мето- дами факторного анализа .................................... 164 1. Некоторые общие положения..............................164 2. Степень трудности тестов...............................165 3. Процедура оценки результатов и скорость их достижения . . 165 4. Проблема мотивации.....................................166 5. Обследуемая группа.....................................167 6. Правильная организация эксперимента....................168 7. Научный отчет.................:........................170 Заключение........ 172 Важнейшие термины, встречающиеся в факторном анализе........176 Приложение к русскому изданию...................................181 Библиография....................................................187 Предметный указатель............................................197 ЯН ОКУНЬ ФАКТОРНЫЙ АНАЛИЗ Редактор К. М. Чижевская Техн, редактор К. К. Сенчило Корректор Л. П. Зуева Худ. редактор Т. В. Стихно Сдано в набор 17/VH 1973 г Подписано к печати 10/XII 1973 г. Формат бумаги 60x90Vi«. Бумага № 3. Объем 12,5 леч. л. Уч.-изд. л. 13,38. Тираж 12 000 экз. (Тематический план 1973 г. № ПО) Заказ № 377. Цена 94 к. Издательство «Статистика», Москва, ул. Кирова, 39. Московская типография № 4 Союзполиграфпрома При Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли, Москва, И-41, Б. Переяславская, 46.