Вы находитесь на странице: 1из 118

РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ

СОЦИОЛОГИИ

И.Ф.Девятко
ДИАГНОСТИЧЕСКАЯ
ПРОЦЕДУРА
В СОЦИОЛОГИИ
ОЧЕРК
ИСТОРИИ и
ТЕОРИИ

МОСКВА "НАУКА" 1993


ББК 60.5
Д 25
ПРЕДИСЛОВИЕ
Значительная часть людских забот так или иначе связана с
процедурой, которую принято называть диагностической. Нормаль-
ные люди не знают, да и не обязаны знать, что они говорят
Ответственный редактор доктор прозой и пользуются, с переменным успехом, диагностическими
философских наук, профессор Г.С.БАТЫГИН приемами. Читающему эти строки тоже приходится распознавать
нечто, скрывающееся за печатными знаками. Задача, для решения
которой используется диагностическая процедура, формулируется
просто: кто есть кто и что есть что? Такого рода задачи обычно
Рецензенты:
решаются с лета. "Не инженер ты - хам", - диагноз, который
доктор психологических наук, профессор С.И.СЪЕДИН, русский интеллигент Васиссуалий Лоханкин выставляет своему
кандидат философских наук М.С.КОСОЛАПОВ недругу мнимому инженеру Птибурдукову. Разумеется, в основе
столь сурового заключения лежит некая рационально
реконструируемая секвенция от внешне заданной видимости к
Редактор издательства Л.В.ПЕНЯЕВА скрытому смыслу: "почто жену уводишь от меня?". Иными
словами, полученное новое знание является в определенной степени
обоснованным. В отличие от опростившегося интеллигента,
эпистемолог думает над тем, каким образом возникает знание о
хамстве и принадлежности к профессиональной группе инженеров.
Здесь мы погружаемся в океан неразрешимых проблем. Лишь
немногие знают, что дать окончательный ответ на вопрос "Что есть
что?" невозможно. И, тем не менее, ремесло социолога
заключается в поиске ответа на такие вопросы. А эпистемолог занят
обоснованием невозможного.
Человек - "обыденный эпистемолог", - приобретая опыт распо-
знавания и "измерения" для решения практических задач,
осваивает технику часто нерефлексируемых диагностических
заключений. Со временем он понимает, что понимание
действительности требует умения держаться от нее на приличном
расстоянии. "Глаза есть мимолетное, как бы в некотором дуновении
открывшееся, изображение души" - эта гегелевская мысль
самодостаточна и не терпит идиотского вопроса: "Что есть в
глазах такого, что изображает душу?" Здесь начинается область
умного видения, куда не следует входить с инструментом научной
рациональности, которая обязана расколдовывать и профанировать
"высокое". В самом деле, никакая, даже самая изощренная
диагностическая процедура не может ни на йоту продвинуть нас в
решении вопроса, почему человек похож на себя.
Профессиональное призвание эпистемолога и методиста заклю-
чается в расколдовании и профанации того, что ребенок научается
делать в первые годы жизни. Если угодно, эту интеллектуальную
экспансию, превращающую жизнь в проблему, можно легко опоро-

ISBN 5-02-008211-2 ©И.Ф.Девятко, 1993


©Российская академия наук, 1993
чить либо просто отвергнуть как предрассудок. Но нельзя отрицать, Есть некоторые основания полагать, что "дух действительности"
что у нее есть своя история, в которой были и озарения, и разоча- не испытывает желания являть себя абы кому и ведет неравную игру
рования, но не было иллюзий, будто проблемы решаются легко. Из с диагностом, постоянно подсовывая ему подделки. Люди, разбира-
книги И.Ф.Девятко читатель узнает, как усовершенствовались из- ющиеся в том, что есть что и кто есть кто, принимают игру и иногда
мерительные инструменты в социологии и социальной психологии, выигрывают. Одним из таких - опытных - людей был Яков Иосеф,
почему основатель диагностической традиции Луи Терстоун в один старый раввин из Бердичева. Однажды к нему приехал в гости рабби
прекрасный день прекратил заниматься тестированием и что имел в Менахем Мендель и люди, собравшиеся у дома, обмерли, увидев в
виду один юный методист, изображавший на капустнике в Бюро каком наряде он вылезает из брички. Мендель был обут в башмаки
прикладных социальных исследований Колумбийского университета с большими серебряными пряжками, шляпы на нем не было, а в
своего шефа Пауля Лазарсфельда, когда говорил назидательно: зубах он держал длинную трубку. По прошествии некоторого време-
"Меня интересует не пол, а как он устанавливается". Вне всякого ни люди спросили Иосефа, что он думает об этом деле. "Так рабби
сомнения, это история мысли, где за каждым поворотом открывается Мендель в куче золы заносчивости укрыл смирение духа, чтобы силы
новое, необозримое и захватывающее пространство. От читателя зла не могли коснуться его", - ответил учитель. Из этой буберовской
требуется немало терпения, чтобы следовать за автором по методи- легенды следует, что переход от "видимости" к "сущности" равно-
ческим лабиринтам, но терпение вознаграждается: диагностическая значен овладению замыслом происходящего, замыслом, который
процедура обнаруживает свое устройство. открывается исключительно путем "непосредственного усмотрения".
И.Ф.Девятко сознательно избегала мучительного философствова- Осуществлять диагностическую процедуру можно двумя способа-
ния по поводу затруднений, постоянно возникающих в процессе ми. Первый способ - выведение внешних признаков из "замысла"
социологического измерения. Тем не менее, некоторая философская -доступен лишь избранным - тем, кто обладает умением видеть идеи.
пропедевтика не помешает, во всяком случае в рамках редакторского Такое знание мы можем назвать "демоническим". В знаменитом
предисловия. Проблему диагностики лучше видно, если выйти за ее диалоге о демоне Сократа Плутарх пишет о неком смысле, переда-
пределы. ваемом демоном без посредства голоса. Это смысл соприкасается с
Прежде всего надо обсудить вопрос, как возможна диагностиче- разумением воспринимающего как само обозначаемое: "В сущности,
ская процедура. Если не сводить измерение к действию по прикла- мы воспринимаем мысли друг друга через посредство голоса и слов,
дыванию линейки к предмету, измерение превращается в диагности- как бы на ощупь в темноте: а мысли демонов сияют своим светом
ку - переход от "видимостей" к тому, что существует "на самом тому, кто может видеть и не нуждается в речах и именах, пользуясь
деле". При этом мы знаем, что "видимость" не имеет собственной которыми как символами в своем взаимном общении, люди видят
действительности, а светит отраженным светом "сущности". Только образы и подобия мыслей, но самих мыслей не познают - за
при этом условии возможна диагностическая процедура. Попросту исключением тех людей, которым присущ какой-то особый, божест-
говоря, расплющенный нос и выпученные, как у кролика, глаза венный, как сказано, свет... Речи демонов, разносясь повсюду,
Сократа являют раздражительным и высокомерным афинянам его встречают отголосок только у людей со спокойным нравом и чистой
сократовскую "чтойность". Этот переход - не просто терминологи- душой; таких мы называем святыми и праведниками". Гений,
ческая транспозиция "внешнего" языка на язык "внутренний", но соприкасающийся с предвечными сущностями, может открыть для
искусное оперирование внешними измерениями с целью вызвать науки новый путь, но научная дисциплина обязана осуществлять
наружу дух действительности. Иногда этот дух называют "конструк- свое предназначение как бы на ощупь, в темноте.
том", находя основания в том, что он конструируется из данных. Второй способ диагностической процедуры - выведение "замысла"
Например, мы можем назвать некоторых людей "фашизоидными из внешних измерений - обречен на рутину и разочарование в
личностями" только потому, что они соответствуют определенным возможности постичь загадку бытия. Однако эту работу можно
параметрам адорновской "Ф-шкалы". На самом деле процедура исполнять, не рассчитывая на озарение и не связывая результат с
конструирования "конструкта" не произвольна, а подчинена задаче участием в проекте какого-нибудь нового Гёте. Аллегория, расска-
рациональной реконструкции типа. В этом отношении построение занная Йоханом Галтунгом, хорошо демонстрирует безнадежность
шкал и диагностических методик в чем-то похоже на шаманство: диагностических мероприятий. Предположим, что мы изучаем некий
предварительное знакомство с "духом", а также тщательность и фрагмент действительности, подчиненный логической идее-схеме,
упорство в исполнении аналитического ритуала необходимы для например, шахматную игру. Мы - диагносты - пока ничего не знаем
появления "духа". Как и всякий научный ритуал, диагностическая о замысле игры и не имеем никаких зацепок, чтобы установить
процедура подчинена технической схеме и, коль скоро схема начала значимые для понимания игры измерения в хаосе самых разных
работать, она перестает зависеть от субъективности исследователя. признаков. Путем изнурительных наблюдений мы можем устано-
Дух возникает сам из глубины признакового пространства, а не вить, что движение фигуры, похожей на лошадь, подчинено одной
создается творческим воображением научного сотрудника. и той же Г-образной схеме; один из игроков впадает в грустное
расположение духа; большую часть времени люди сидят, о чем-то латентная переменная отображается множеством операциональных
раздумывая - из всех этих наблюдаемых регулярностей требуется измерений, каждое из которых обладает некоей мерой близости к
вывести правила игры. Но, не зная правил, нельзя понять действия порождающей смысловой модели. Это обстоятельство дает возмож-
"актеров". Шахматист, знающий теорию игры, конечно, увидит все, ность строить диагностическую процедуру на "батареях" шкал и тем
что необходимо для диагноза. Учебник "дебютов" и "эндшпилей" самым добиваться высокой надежности итоговых измерений. Соот-
-книгу жизни - не удалось почитать еще никому из смертных. И, тем ношение симптома и латентной переменной может трактоваться в
не менее, герменевтический круг разрывается обнаружением стати- терминах логического следования и тогда мы скажем, что это
стических "регулярностей", отображающих правила игры. Мы не соотношение объяснимо. Проживание обследуемого в районе Золо-
можем установить смысловую связь внешнего "измерения" с латен- того берега не вызывало у чикагских социологов сомнений в том, что
тной переменной в каждом единичном случае, но вариация стати- данный человек имеет высокий социальный статус - в этом районе
стических распределений указывает на неслучайные (при опреде- могут нанимать жилье только очень состоятельные люди. Однако в
ленной степени вероятности) соотношения. Пунктуальный человек социологии и социальной психологии встречаются такие пары, чье
может опоздать на поезд, но "опоздания" с высокой степенью избирательное сродство не то чтобы непонятно, но вызывает изум-
вероятности показывают "рассеянность". Таким образом, если "дух ление: в 30-е годы Пауль Лазарсфельд показал, что пролетариат
действительности" вызывается шаманством, то это шаманство - не любит сладкое. Зная, что любовь к сладкому - симптом пролетарской
что иное, как математико-статистическое исполнение процедуры. принадлежности, можно пренебречь логическими фигурами. Сказан-
Как преодолевается смысловая дистанция от внешнего "измере- ного достаточно. Таким образом, связь явных и латентных измерений
ния" до аутентичного признака объекта? В зависимости от того, как может основываться исключительно на статистических континген-
это делается, можно выделить три типа диагностики. циях - это не делает их менее полноценными, чем логически
Первый тип основан на редукции измеряемого качества к опера- обоснованные пары.
циональной переменной - шаг, в немалой степени обусловленный Третий тип диагностической процедуры характеризуется удиви-
"натуральным" происхождением измерителя, высокой точностью и тельным и причудливым возникновением "истинного" качества из
устойчивостью наблюдений. Возраст редуцируется к ответу на воп- факторизации переменных. Фактор, объединяющий некоторое коли-
рос: "Сколько Вам лет?", образование - к свидетельству об образо- чество взаимосвязанных признаков, требует "осмысления", и "кон-
вании, а национальность - к "национальности". Здесь работают структ" возникает как "Deus ex machina". Аналогичные явления
мощные культурно-эпистемические "паттерны", принуждая социо- конструктов присущи также анализу латентных структур и всему
логов к натурализации измерений, хотя нетрудно показать, что комплексу техник, известных под наименованием "структурные
некоторые люди задерживаются в возрасте подростка до сорока лет уравнения с латентной переменной".
и более, свидетельство о высшем образовании вовсе не означает Следует остановиться также на том, что подлежит диагностике.
умения писать без грамматических ошибок, а многие евреи оказы- Обычно эту процедуру связывают с измерением личностных качеств.
ваются русскими. Первый тип диагностической процедуры порожда- Методики личностного тестирования можно найти в десятках психо-
ет ясные и отчетливые суждения о действительности и, в то же время, логических журналов. Измерение установки - как раз та область, где
не позволяет забыть их немножко искусственное происхождение. диагностическая процедура чувствует себя дома. Несколько обособ-
Второй тип диагностической процедуры предполагает сохранение ленную область ее применения образуют групповые качества - "дух"
дистанции между операциональными конструкциями языка наблю- групповой сплоченности явлен, например, нормированной суммой
дения и "истинными" параметрами объекта. В данном случае наблю- позитивных выборов в социометрической матрице. Аристотелевская
дения квалифицируются как симптомы некоего латентного качества, "филия" таким измерителем не располагает. Предметом диагностики
которое может обнаруживать себя и иным образом. Изменение цвета могут быть и социальные институции - геополитические образова-
лакмусовой бумажки означает наличие кислоты или щелочи в ния, национальные, религиозные и тому подобные сообщества. Как
растворе; скорость оседания эритроцитов - симптом воспалительного правило, здесь используются самые незатейливые измерения. На-
процесса в организме; количество публикаций - показатель продук- пример, одни общества довольно уверенно называются тоталитарны-
тивности ученого; двери коттеджа, открывающиеся наружу, - при- ми, а другие - демократическими. Достаточно проницательные люди,
знак того, что хозяева дружат с соседями, чей дом находится на Л.Фейхтвангер, Т.Драйзер, Р.Роллан, надо полагать, искренне за-
противоположной стороне улицы, - все эти соотношения имеют свидетельствовали демократизм сталинского режима - они воспри-
вероятностный характер и, даже в том случае, когда симптом няли торжество новой юности как значимое измерение и пренебрегли
практически безошибочно позволяет предсказывать определенное отсутствием в Советском Союзе многопартийности.
значение латентного признака (например, РОЭ - воспалительный Здесь, в предисловии к книге, посвященной вопросам социологи-
процесс), элементы этого бинарного отношения сохраняют свою ческого измерения, небесполезно заметить, что диагностическая
смысловую автономию и не редуцируются друг к другу. Более того, процедура начинается чуть раньше, чем нужно, - сначала формиру-
ется "пространство признаков", которое Луи Гуттман очень точно знания, например, "софт-методологии", но, скорее, о тотальной
определил как "вселенную". Измерения, образующие пространство, экспансии в корпус науки и создании некоей разновидности жанра
должны обладать удивительным свойством значимости для представ- паразитической критики с гуманитарных позиций. Это происходит
ления смыслов, положенных в действительности, короче говоря, они на фоне ламентаций о репрессивной роли научного знания как
должны быть "релевантными". Этот термин возвращает нас к воп- формы власти. "Совращение" к тому же сопровождается претензи-
росу о том, как возможна диагностика. ями на чудесное постижение повседневности без использования
Если бы релевантность определялась только как некоторая смыс- занудных техник шкалирования. Социологическая профессия не в
ловая дистанция между измеряемым и измерителем, было бы пол- силах противодействовать столь жесткой экспансии мягких методов,
беды. Беда в том, что релевантность-значимость устанавливается в но вполне возможно предотвратить смешение разнородных субстан-
контексте теории, - затруднение, известное в литературе как тезис ций, смешение, от которого обычно болит голова. В книге И.Ф.Де-
Куна-Фейерабенда. Неизбежность фактов, не сумев совладать с этим вятко показано, что социология занимается не "финальными", а
открытием, в очередной раз уступила место в науке воле и представ- предпоследними истинами, критерием которых является правильная
лению. Опять "тематизировался" выбор между двумя интеллекту- процедура.
альными манерами: принять ли процессуальный кодекс дисципли- Доктор философских наук Г.С.Батыгин
нарно организованного знания (так принимаются к исполнению
процессуальные нормы при установлении квалифицирующих при-
знаков вины) или избрать жанр интеллектуальных бесчинств и
принять участие в массированной атаке на теоретический дискурс и
"кумулятивистскую" традицию в науке. Вызов, именующий себя
постмодернистским, декларирует отказ от диктата "Закона", находя
новую эпистемическую перспективу в "порождении реальности". В
основе порождающих структур, лишившихся безыскусной поддерж-
ки фактов, обнаруживаются "Идеальная игра", "Деконструкция
дискурса" и "Совращение". Если говорить о подобном отношении к
реальности как о традиции, то дело почти исчерпывается сартровской
"Тошнотой". Немаловажно и то обстоятельство, что тематический
репертуар и сама интонация постмодерна явно рассчитаны на удов-
летворение вполне определенного вкуса читающего бомонда. Это
вкус эпатажа и "деконструкции" сексуальных эпизодов, часто не
вполне удачных. В русской литературе периода либерализации
постмодерн проявляет себя более прямолинейно в деконструкции
тривиального матерщинного дискурса. В любом случае нельзя отри-
цать зависимости рассматриваемого жанра от публики, не имеющей
специальной профессиональной подготовки, хотя правила жанра
исполняются виртуозно. "Это теоретическая фантастика (Theory-
fiction), которая не похожа ни на что появлявшееся ранее", - так
оценила газета "Либерасьон" книгу влиятельного социолога Жана
Бодрийяра "Совращение" (1979). Теоретик постмодерна исходит из
того, что человечество вступает в эру финальных решений, когда
снимаются различия меяоду явным и латентным дискурсами: повер-
хностный дискурс выпускает наружу глубинный порядок, подменя-
ющий очарование и иллюзию видимостей, чтобы лишить его силы.
Видимости в конечном счете оказываются не пустяками, а удобными
случаями для игры и ее ставок, а (также страсти к девиации
-совращению самих знаков, а это более существенно, чем возникно-
вение самой истины. Достоверное знание здесь утрачивает смысл.
Под влиянием постмодерна происходят существенные изменения
в тематическом репертуаре социологической методологии. При этом
речь идет не только об образовании новых периферийных областей
8
Глава первая хода от эклектической практики сбора эмпирических данных о мне-
ниях, намерениях и поведении людей с использованием муниципаль-
ИЗМЕРЕНИЕ УСТАНОВОК В АМЕРИКАНСКОЙ СОЦИОЛОГИИ ной статистики, опросов экспертов и представителей "элиты" и на-
И СОЦИАЛЬНОЙ ПСИХОЛОГИИ: блюдения условий жизни к прямым и стандартным способам измере-
ЗАРОЖДЕНИЕ СОЦИОЛОГИЧЕСКОЙ ПАРАДИГМЫ ния "субъективных показателей". Вообще говоря, в американских об-
щенациональных обследованиях 20-х - 30-х годов в ряде случаев ис-
пользовались опросные процедуры, нацеленные на выявление мнений
1. Становление основных подходов к и установок о профессиональных планах молодежи, причинах миг-
измерению установок (1920-е - 1930-е годы) рации и т.п. Однако неразработанность проблем выборки и измерения
Ранний период развития эмпирических социальных исследо- и отсутствие четкой концептуализации понятий "установка" и "мне-
ваний - от восходящей к XVIII в. политической арифметики до пере- ние" делала эти первые попытки весьма уязвимыми для критики. Эта
писей и статистических обследований конца XIX в. - заложил суще- критика исходила, прежде всего, со стороны академической науки,
ственные предпосылки развития социологических методов. Однако не имевшей практики столь широкомасштабных исследований "ре-
между этим ранним периодом и "зрелой" эмпирической социологией, альной жизни", но обладавшей сложившимися канонами эмпириче-
ского обоснования научного вывода. Весьма показательна позиция,
о которой пойдет речь в этой книге, существует принципиально важ- сформулированная в 1926 г. на собрании научного общества экспе-
ный качественный разрыв. Те исследователи, которым социологиче- риментальной психологии: "Решено, что это собрание осуждает воз-
ская наука более всего обязана возникновением специальных проце- растающую практику сбора административных или мнимо научных
дур для получения эмпирического знания о социальном мире, в боль- данных посредством вопросников, и что собрание в особенности по-
шинстве случаев не считали себя социологами и видели смысл своей рицает практику, когда аспиранты предпринимают исследования,
исследовательской работы не в проверке "больших" социологических рассылая вопросники профессиональным психологам" ( [206 ], цит. по:
теорий классического периода, а в получении достоверного фактиче- {109. С.54]).
ского знания об условиях и уровне жизни в городах, бедности, соци-
альных последствиях индустриализации и т.п. Социальные обследо- Разумеется, критика "академических пуристов" не могла поло-
вания второй половины XIX - начала XX веков были явно и неявно жить конец традиции обследований и опросов, которая в начале 30-х
связаны с общественными дискуссиями и социальными реформами годов имела и сложившийся "социальный заказ", и разветвленную
систему финансовой поддержки (зачастую более основательную, чем
своего времени. Разумеется, и для британских социальных статисти- академическая наука) . Поборники социальных обследований продол-
ков Х1Хв., и для участников первых американских крупномасштаб- жали использовать любые доступные данные индивидуального уровня
ных социальных обследований начала нашего столетия первостепен- (установки, мнения, факты поведения) , при этом теоретическая ин-
ное значение имела идея объективности и надежности сведений - "со- терпретация фокусировалась на понятии "установка". Именно к на-
циальных фактов", - добываемых с помощью прямого наблюдения. чалу 30-х годов нашего столетия стала складываться собственно со-
Данные переписей, обследований и статистических описаний, собран- циологическая традиция измерения субъективных переменных, от-
ные таким образом, рассматривались как твердый фактический фун- личная от традиции психологического измерения, хотя и испытавшая
дамент для социальной политики и административных реформ. При Со стороны последней очень большое влияние. При этом первой об-
этом обоснованность убеждения в объективном характере социальной ластью дифференциации социологической и психологической пара-
статистики не ставилась под сомнение, не "проблематизировалась". дигм измерения стали исследования установки.
Задача выработки и последовательного обоснования собственно на- Если оставить в стороне раннюю предысторию понятия установки
учных методов социального исследования была вполне осознана лишь в психологии (например, "моторная установка" Н..Ланге и Т.Рибо,
к концу первой трети нашего века в США, где академическая соц- ''установка сознания" в работах психологов вюрцбургской школы),
иология впервые получила автономную и прочную институциональ- то появление в социальной психологии и социологии термина "уста-
ную поддержку и стала нуждаться в собственном идеале "объективной новка" (аттитюд) в значении, близком к современному, связано с име-
науки", отличном от прежнего идеала "реформистской науки". Не- нем У.Томаса, который в совместной с Ф.3нанецким| работе "Поль-
удивительно, что упадок движения социальных обследований в Аме- ский крестьянин в Польше и в Америке" (1918-1920) ввел общее по-
рике совпал по времени с возникновением эмпирической социологии нятие установки как состояния сознания, выражающегося в потен-
и ростом интереса к методическим и процедурным проблемам [103 ]. циальной активности по отношению к ценностным объектам. Вокруг
Таким образом, к началу 30-х годов социальные обследования, воз- Точной дефиниции этого понятия уже в 20-е и 30-е годы развернулась
никшие первоначально как некоторое "научное обоснование" соци- бурная полемика, освещение которой не входит в нашу задачу 1 . За-
альных реформ, столкнулись с необходимостью выработки более стро-
тах критериев собственной научности. Появилась потребность пере- 11

1
Детальный обзор подходов к определению понятия "установка" можно найти, например, в [4; 70;
178].
метим лишь, что если в социальной психологии большое значение периментальной традиции и включать сведения о надежности и ва-
придавалось поведенческим и познавательным компонентам уста- лидности, испытуемые должны были быть досягаемы для повторных
новки, то в социологических дефинициях основным чаще оказывался процедур и обладать достаточно высокой грамотностью, компетент-
эмоционально-оценочный компонент (примером может служить оп- ностью и навыками саморефлексии. Кроме того, существенным фак-
ределение установки у Терстоуна, понимавшего ее как уровень тором была и "дешевизна" экспериментов со студентами.
напряженности позитивных или негативных чувств, связанных с Хотя многоуровневость структуры установок и нелинейность
объектом установки [233 ]). Основным, однако, было не различие в связи установок и мнений осознавалась достаточно отчетливо, пси-
дефинициях, а различие в исследовательских подходах и процеду- хологи в меньшей мере, чем социологи, склонны были сомневаться
рах. Психологи, изучавшие установки, были наследниками экспери- и в валидности своего измерительного инструмента, и в онтологиче-
ментальной традиции и, оставаясь чрезвычайно требовательными к ском статусе самого измеряемого конструкта, т.е. установки2 .
соблюдению ее норм, вместе с тем мало заботили, а о подобии мира Своеобразие социологического подхода к измерению определялось
лаборатории реальному социальному контексту. Социологи же, осо- не только теоретическими представлениями о предмете и методах со-
бенно те из них, кто работал вне университетских кампусов, были циологии, но и конкретными особенностями профессионального со-
весьма нечувствительны к достоинствам экспериментального метода общества и сложившимися в первой трети века типами исследова-
и ощущали, что, невзирая на все недостатки, массовые опросы тельской практики. Прежде всего, в подготовке профессиональных
.социологов количественные методы и основы математической стати-
позволяют получать данные о группах, субкультурах и их влиянии стики часто играли роль факультативных элементов. "Количествен-
на личность. На внешнем, процедурном уровне различие проявля- ной" стороной" американской академической социологии занимались
лось в технике измерения, выборе респондентов и условий проведе- преимущественно демографы и отдельные специалисты в области ста-
ния исследования, а также в предпочтении индикаторов. тистики. Экспериментальная традиция с ее "культом" квантифика-
Отличительными особенностями психологического подхода к из- ции в социологии (в отличие от психологии) отсутствовала. Как от
мерению установок в 20-е - 30-е годы было использование данных мечает Дж.Конверс, "большинство социологов, начавших
вопросников, допускающих квантификацию, студентов-испытуемых интересо-
в приближенных к лабораторным условиям классной комнаты и ваться установками, еще недостаточно владели количественными тех
декларируемых мнений в качестве индикаторов установок. Социоло- никами. Они склонны были работать интуитивно с неструктуриро-
ги больше были ориентированы на использование интервью и мето- ванными интервью, без стандартных опросников или бланков, исполь-
дов "анализа случая", поиск различий между субкультурными груп- зуя жизнеописания (письменные или устные), дневники, письма и
пами (а не индивидами), проведение полевых исследований различ- другие личные документы о качественных сторонах жизни" [109.
ных реальных общностей (а не студенческих групп в аудитории) и Р.59-60 ]. Некоторые социологи стремились интегрировать качествен-
учет поведенческих индикаторов установки наряду с вербальными. ные и количественные методы исследования, полагая, что основанные
В психологии в этот период появилось огромное количество работ на качественных данных гипотезы могут быть подкреплены строгой
по измерению установок. Их авторы стремились, с одной стороны, статистической проверкой на более обширном материале (Э.Бёрд-
ввести квантификацию в исследование субъективных смыслов и таким жесс, У.Огберн, Ст.Райс). Однако препятствием здесь зачастую яв-
образом создать серьезную альтернативу радикальному бихевиориз- лялась сама природа данных, доступных социологу в то время: про-
му, а с другой - расширить сферу применения психометрического под- блема выборки до середины 30-х годов не имела даже строгого тео-
хода и теории тестов. Испытуемыми обычно оказывались студенты. ретического решения (строгое обоснование основ современного выбо-'
В обзоре Г.Мерфи, Л.Мерфи и Т.Ньюкома, опубликованном в 1931г., рочного метода в социологии было дано Ежи Нейманом лишь в работе
из 55 исследований установок лишь 5 были проведены вне колледжа 1934 года (см.: [74])), а в практику социологических исследований
со взрослыми испытуемыми, а в 45 исследователи имели дело исклю- идеи вероятностной выборки и стратификации прочно вошли лишь в
чительно со студентами [186 ]. В классическом обзоре 1935 г. Гордон 40-е годы3.
Олпорт [70 ] даже не упоминает, что основная часть анализируемых
им исследований проводилась на студентах или школьниках. При этом
студенты рассматривались не как специфическая группа, а как пред-
ставители "людей вообще". Среди причин этого положения вещей для 2
Наиболее последовательной критике исследования индивидуальных мнений и установок в
нас наиболее существенны следующие: 1) психологи обычно исполь- эмпирической социологии были подвергнуты представителями критической социологии.
Однако произошло это позднее, в 50-е годы [66; 198].
зовали более сложные инструменты измерения и более точные гипо-
тезы в условиях, близких к лабораторному эксперименту по степени 3
Огромную роль в распространении идей репрезентативной выборки и количественных
контроля; 2) это, в свою очередь, требовало стандартных процедур и методов сыграла группа социологов, многие из которых учились в Колумбийском университете
высокой готовности к сотрудничеству со стороны исследуемых. Так у Ф.Педдингса (в Колумбии курс дескриптивной статистики был введен в 1890-егоды [193]).
как описание результатов должно было соответствовать канонам экс- Влияние колумбийской социологической школы вплоть до 1920-х . гг. было чрезвычайно
велико. Однако оформление количественной, " строгой" ориентации происходило лишь
12 постепенно. Как показал недавно С.Тернер, многие ориентированные на статистические методы
социологи " колумбийской семьи" были тесно связаны с реформаторскими социальными
обследованиями и не стремились к немед-
13
Социологи, и особенно те из них, кто разделял методологические «групповое» заблуждение, то в такой же мере возможно и "индиви-
представления Чикагской школы, стремились к исследованию есте- дуальное", и весьма рискованно измерение индивидуальных свойств,
ственных групп и общностей в условиях "реального мира". Это Изолированное от группового контекста. Сами установки индивида,
делало невозможным механическое заимствование идей его ценностные ориентации и даже личностная идентичность произ-
экспериментального контроля, стандартизации и квантификации из Црдны от интерсубъективных отношений в группе, от "интерсоци-
других поведенческих наук. Названные идеи в этот ранний период ной стимуляции" друг друга членами группы4. Однако эта конкретная
могли быть воплощены лишь при условии отказа от изучения дискуссия еще не содержала сколь-нибудь детализированного исания
естественных групп и общностей, субкультур, проблематики различия в проведении исследований. Различие стало
культурной детерминации личности. Социологов же интересовали очевидным позднее, когда вскоре каждый из ученых опубликовал
именно "труднодоступные" общности и носители установок - шкалу измерения установок. Как убедительно показала Дж.Конверс,
эмигранты, бродяги, делинквенты и т.п. В силу этой это событие очень иллюстративно для понимания того, как различия в
заинтересованности основными методами сбора данных были методологических подходах отразились в исследовательской
включенное наблюдение, нестандартизованное интервью, не практике "родственных" дисциплин [109. Р.62-68].
подразумевавшие детальной регламентации процедуры и строгого
следования нормам "опытной науки". Так, Р.Лапьер, изучавший
расовые установки французов и англичан, путешествовал, 2. Шкалы социальной дистанции и традиция измерения
завязывая разговоры с попутчиками в вагонах первого, второго или в Чикагской школе
третьего класса, с посетителями ресторанов. При этом различия Э.Богардус, защитивший докторскую диссертацию по психологии
между респондентами были настолько сильны, что немыслимо было Чикагском университете по влиянию утомления на
задать англичанину тот же "стандартный" вопрос, что и французу, - производственный травматизм и позднее работавший в
пригласит ли он негра в свой дом. Приходилось жертвовать университете Южной Калифорнии, испытал сильное влияние
стандартизацией условий и сопоставимостью (а значит и Чикагской школы СОЦИОЛОГЕ, и особенно У.Томаса. Всю свою
возможностью классификации, табулирования и др.) и спрашивать, продуктивную профессиональную деятельность он посвятил
допустимо ли, когда черные и белые дети играют вместе. социологии.
В целом, к концу 20-х годов социологи были склонны использо- Богардус изобрел "шкалу социальной дистанции", опираясь на
вать разные типы индикаторов установок: данные личных наблюде- вдеи Р.Парка [195 ]. Хотя шкала была основана на прямых самоот-
ний за естественным поведением (как в полевых исследованиях четах о предполагаемом поведении, т.е. респонденты должны были
Чикагской школы); статистический анализ объективных "нереактив- :ообщить, как бы они себя повели, а не выразить свои политические
ных" показателей поведения - данных голосования, публикаций в
прессе и т.п. (пионером здесь был Стюарт Раис [202]); методы убеждения или оценку чьих-то действий, по замыслу автора, она
"анализа случая" и данные личных документов (Э.Богардус, Ф.Зна- должна была измерять установки по отношению к группам и способ-
нецкий и др.); и, наконец, шкалирование установок. Именно в ствовать анализу структурных отношений, приспособления и кон-
области измерения установок начала оформляться специфическая фликтов. Богардус не стремился соотнести установки с личностными
традиция социологического измерения, отличная от подходов, офор- чертами (в отличие от Олпорта) и, более того - не считал количест-
мившихся в психологии или эконометрике. Однако эти отличия были венное измерение установок с помощью шкалы сколь-нибудь надеж-
следствием не изолированного и недоступного "внешним" влияниям ным и самодостаточным. Здесь, как отмечает Дж.Конверс [109.Р.63 ],
развития, а логически вытекали из переосмысления и творческого эн явно следовал традиции Чикагской школы. Измерения расовых
заимствования концепций и методов измерения, развивавшихся установок с помощью шкалы он дополнял личными интервью с
демографами, экономистами и особенно психологами. История раз- эеспондентами, чтобы убедиться, что "шкальные" оценки действи-
работки первых шкал установок (Ф.Олпорт и Э.Богардус) позволяет гельно совпадают с мнениями, высказываемыми в более неформаль-
понять причины, по которым шкалирование приняло разные формы ной беседе [93]. И хотя, строя шкалу, Богардус основывался на
в социологии и психологии [109. Р.62 ]. достаточно отчетливых представлениях о кумулятивности, он не стал
В 1924г., когда психолог Флойд Г.Олпорт призвал социологов )азвивать непосредственно следующие отсюда идеи об определении
отказаться от преувеличения роли "группового сознания" и попы- положения респондента на одномерном континууме латентных ка-
таться объяснить феноменологию группы с позиций социальной честв (что было сделано позднее Л.Гутманом, принадлежавшим уже
психологии личности, социоло Эмори С.Богардус в том же номере к "количественной" традиции в социологии). В редактировавшемся
"Американского социологического журнала" высказал весьма суще-
ственные возражения против такого подхода [68 ]. Если возможно
4
ленному отказу от идеалов социальной статистики в пользу академической "чистой Интересно отметить, что самая радикальная критика попытки Олпорта представить
науки" [236]. группу как воображаемый, номинальный " ярлык" и признать " реальными фактами"
лишь суждения, касающиеся отдельного индивидуума, содержится в "Основаниях
14 социологии" Дж.Ландберга (именно в той работе, где излагается последовательно
операционалистский подход к социологическому измерению) [173. Р.164-165].
Богардусом журнале "Sociology and Social Research" (первоначально превосходства личных документов и автобиографий над другими
"Journal of APPlied Sociology") публиковались статьи по мерам источниками социологических данных, критика Г.Блумером анализа
социальной дистанции различных групп (расовых, религиозных, переменных и непопулярность аналитико-статистических методов в
профессиональных, возрастных), но, как отмечает Дж.Конверс, "из- среде чикагских исследователей.
рядная часть опубликованных здесь работ была свободной от данных, Бесспорно, ведущие социологи "Чикагской" ориентации весьма
импрессионистской или концептуальной..." [109.Р.65]. И этот "эс- скептически оценивали попытки создать "научную социологию",
сеизм" был связан не столько с неприязнью к измерению вообще или основанную на принципах репрезентативной выборки, операциона-
недостаточной подготовкой в области статистических методов (дол- лизации теоретических понятий и статистической проверки гипотез.
гая жизнь шкалы социальной дистанции явно свидетельствует о Однако даже столь радикальный защитник субъектно-ориентирован-
высокой методической культуре их создателя), сколько с различием яых биографических методов, как У.Томас, совсем не склонен был
интеллектуальных традиций социологии Чикагской школы и экспе- Is считать методы статистического причинного вывода неким опасным
риментальной психометрии. я бесплодным соблазном эмпирической социологии. Вернее будет
Работы Э.Богардуса и Ф.Олпорта, знаменовавшие собой ранний сказать, что У.Томас выступал против излишней стандартизации и
этап измерения установок, обострили уже существовавшие в сверх-рационализации методов исследования, против "методологи-
социологии противопоставление качественных "case studies" и ста- ческой ортодоксии", препятствующей диалогической включенности
тистически, т.е. количественно, ориентированных исследований5. социолога в исследуемую ситуацию и подменяющей содержательную
Работы Богардуса могли рассматриваться как вклад в "Чикагскую проблематику процедурными и техническими задачами. В 20-е - 30-е
традицию квантификации", "но сам он, видимо, не имел таких годы У.Томас во все большей мере склонен был принять возможность
устремлений" [109. Р.67]. По сути "психологически-ориентирован- использования количественных методов при условии их применимо-
ные" работы Олпорта оказались в тот момент более значимы для сти к определенному биографическому материалу [143. Р.76 ]. В ряде
развития идей шкалирования, так как именно они послужили непос- диссертаций, защищенных в Чикаго в начале 30-х годов, анализи-
редственным толчком к созданию шкалы Л.Л.Терстоуна. ровались сравнительные преимущества стандартизированных мето-
Однако, прежде чем обратиться к анализу "психологической дов измерения установок и биографического подхода (Стауффер,
ориентации" в шкалировании (Ф.Олпорт, Л.Терстоун и РЛикерт), Браун). Дискуссии о качественных и количественных методах не
нам предстоит рассмотреть более широкий контекст, в котором идеи привели к формированию жесткой "антистатистической" позиции и,
Э.Богардуса не только формировались, но и интерпретировались судя по воспоминаниям участников событий, скорее послужили
современниками. Этим контекстом, как уже говорилось, были взгля- толчком к интеграции двух подходов [143. Р.77-78]. Общая для
ды социологов Чикагской школы на соотношение "количественного" американской социологии 30-х годов тенденция к смещению центра
"методологического диспута" с проблемы применимости статистики к
и "качественного" в методологии социальных наук. Обозначенная проблеме измерения и операционализации теоретических понятий
таким образом проблема неоднократно анализировалась историками была характерна и для чикагских социологов.
социологии, однако в последнее десятилетие устоявшиеся ее трак- Хотя ведущие представители школы (наиболее очевидный пример
товки подверглись радикальному пересмотру. Поводом для этого - Г.Блумер) чаще всего отрицали дефинитивную природу теорети-
стали некоторые работы М.Балмера (и, позднее, Л.Харви), посвя- ческих понятий в социологии и, следовательно, возможность их
щенные "количественной традиции Чикагской школы". Обычно операционализации, они не стремились к выработке абсолютно
Чикагская социология описывалась как ориентированная на этногра- неповторимой и самобытной "Чикагской" позиции в методологии.
фические, т.е. "качественные", методы и враждебная "статистике" Иными словами, есть основания говорить о раннем "методологиче-
и "позитивизму". В определенной мере этот взгляд был связан со ском плюрализме" чикагцев, стремившихся гибко использовать и
стремлением историков социологии сконструировать согласованный качественные, и количественные методы в зависимости от обстоя-
и отчетливый образ Школы как некоторой интерпретативной, фено- тельств и исследовательской ситуации. Даже позиция Р.Парка не
менологической альтернативы преобладавшему в американской была столь "антистатистической", как иногда считают. Для Парка,
социологии количественному, помологическому подходу. Как это как и для У.Томаса, характерен был крайний антинатурализм.
нередко случается в истории науки, столь непротиворечивая и ясная Однако он не отрицал полезности статистических данных и социаль-
интерпретация оставила "за кадром" слишком много фактов и ных обследований. Последние, кстати, были темой курса, который
обстоятельств, существенных для дотошного историка. Традицион- он читал в 20-е годы (с 1917 г. - совместно с Бёрджессом), уделяя
ная интерпретация в значительной мере опиралась на общеизвестные особое внимание практическим способам анализа и представления
а факты: нелюбовь Р.Парка к статистике, обоснование У.Томасом данных "полевых исследований" [143. Р.79-80]. Большинство чикаг-
ских социологов, и в первую очередь А.Смолл и Э.Бёрджесс, считали,
5 2 И.Ф.Девятко 17
Своего рода "промежуточную" позицию занимал С.А.Райс, также исследовавший
в конце 20-х годов измерение установок. Он хотя и испытывал влияние работы Ф.Ол-
порта и Д .Хартмана, но пытался найти" нелабораторные" и объективные меры устано-
вок, отличные от мнений (например, результаты выборов).
что студенты-социологи нуждаются в полноценных курсах по стати- 3. Психологическая ориентация:
стике и методам исследования. И Смолл, и Бёрджесс предприняли Ф.Олпорт, Л.Л.Терстоун, Р.Ликерт
все возможное, чтобы "заполучить" У.Огберна, в 1927 г. пришедшего
из Колумбийского университета в Чикагский. Огберн, чья репутация Использованный в заголовке термин "психологичекая ориента-
в области статистики и количественной методологии уже сложилась ция" достаточно условен, но уместен здесь для того, чтобы охарак-
к моменту переезда в Чикаго, принял самое активное участие во теризовать работы, связанные с психологией не столько институци-
многих междисциплинарных проектах, в том числе осуществлявших- онально, сколько сходством в формулировке проблем и методологии.
ся на муниципальном уровне и связанных с проблемами города. Его Ф.Олпорт учился в Гарварде и получил основательную подготовку
преподавательская деятельность повлияла на многих чикагских сту- в экспериментальной психологии. Работая в Сиракьюзском уни-
дентов и лекторов, увеличив их интерес к возможностям и ограни- верситете, он занимался социальной психологией и исследованиями
чениям квантификации в социологии. Когда в 1929 г. было торже- установок. Уже ранние его работы привлекли к себе внимание в среде
ственно открыто новое здание для исследовательских лабораторий психологов и социологов, заинтересованных в проблемах измере-
общественно-научных факультетов, именно Огберн убедил коллег в ния (например, С.А.Райс, ученик Ф.Гиддингса, как и многие его
том, что вход в здание лучше всего украсит афоризм лорда Кельвина: ученики, испытывавший интерес к проблемам квантификации и
"Когда ты не умеешь измерять, твое знание скудно и неудовлетво- немало сделавший для утверждения количественных методов в
рительно". социологии, в монографии 1928 г., посвященной количественным
По мнению Л.Харви, наиболее симптоматичной была позиция методам в политологии [202], уделяет основное внимание проблемам
Э.Бёрджесса, которого он даже называет " барометром методологи- измерения установок и многократно ссылается на близкую к его
ческих тенденций" [143. Р.87 ] Чикагской школы. Бёрджесс активно собственному подходу статью Ф.Олпорта [69 ], а также на личную
участвовал в ранних социальных обследованиях и анализе данных переписку с ним по проблемам распределения мнений). Именно
переписей (в 20-е годы он даже возглавлял Чикагскую комиссию по Ф.Олпорт часто считается одним из основателей "научной", т.е.
переписи). Позднее он широко использовал корреляционный анализ, объективной и эмпирически ориентированной социальной психо-
занимаясь прогностическими исследованиями устойчивости брака. В логии.
этой области он сотрудничал с Огберном - одним из пионеров Шкала Ф.Олпорта (разработанная в сотрудничестве с Д.Хартма-
использования методов частной и множественной корреляции в ном) была куда менее проста, чем шкалы социальной дистанции, и
социологии. Он также считал плодотворным сочетание качественных предполагала весьма высокую осведомленность в политике со сторо-
и количественных методов социологического анализа, когда откры- ны респондентов [69]. В отличие от Э.Богардуса, считавшего, что
ваемые в качественном анализе проблемы исследуются формальны- едва ли может быть надежным измерение, основанное на рефлексии
ми количественными методами. респондентов по поводу своих мыслей, установок и поступков, и
Заметное влияние на сотрудников и студентов социологического довольно настороженно относившегося к прямому измерению "внут-
факультета оказывали и работы экономистов и психологов, препо- ренних состояний", Олпорт не только пытался измерить установки
дававших в Чикагском университете и интенсивно использовавших через мнения, но и соотнести их с личностными особенностями.
статистику и количественные методы анализа. Так, прежде чем Испытуемыми Олпорта были студенты колледжа (и здесь он ориен-
Огберн стал читать курсы по статистике и методам исследования, тировался на экспериментальную традицию, в отличие от чикагских
студенты и аспиранты-социологи посещали курс по статистике, социологов, стремившихся изучать естественные группы и ситуации
читавшийся Л.Терстоуном на факультете психологии [143. Р.80]. И "реального мира"). Высказывания шкалы относились к семи "объ-
Огберн, и учившийся у него С.Стауффер, сотрудничали с политоло- ектам установки", включая Лигу наций, Ку-клукс-клан и "сухой
гами и статистиками Чикагского университета уже в 20-е - 30-е годы закон". Очень важной новацией Олпорта было введение экспертной
проводившими массовые социальные обследования и опросы. процедуры. Этот прием сыграл значительную роль в возникновении
Все сказанное позволяет, по меньшей мере, сделать вывод о том, терстоуновского подхода к шкалированию. Судьи (преподаватели
что единой и консолидированной Чикагской "антицифровой" пози- колледжа) должны были отобрать и упорядочить от одной крайней
ции не существовало. Более того, несмотря на критику со стороны позиции к другой высказывания из письменных сочинений шестиде-
интеракционизма и сдержанно-скептическое отношение Блумера, сяти студентов, содержавших их личные мнения. Отдельные шкалы
Томаса и Парка к статистике, массовым опросам и - шире - к отличались числом градаций и сложностью. Некоторые формулиров-
возможностям помологического подхода, уже в первой трети века в ки были просты ("Кулидж прекрасно подходит для президентского
Чикаго существовала достаточно развитая и интересная традиция поста" в шкале установок по отношению к президенту Кулиджу),
квантификации, повлиявшая на становление методологии социоло- некоторые - весьма сложны и пространны (например, высказывания
гических исследований. шкалы установок по отношению к распределению богатств). Студен-
ты должны были каждый раз выбрать одно высказывание, лучше
18 1
9
всего представляющее их мнение (т.е. конструкция шкалы не пред- ния, сравнивавшиеся по степени их серьезности, и список пар
полагала кумулятивности). Кроме того, непосредственно оценить различных национальностей [226; 227 ]. В последнем случае испы-
степень определенности и уровень интенсивности, с которой они туемому предлагалось решить, с представителем какой националь-
придерживаются своего мнения (было доказано, что это в действи- ности из двух он бы предпочел быть в дружеских отношениях. Сама
тельности одно и то же). Проанализировав распределение мнений и природа полученных Терстоуном данных стимулировала форму-
интенсивностей, Олпорт и Хартман заключили, что "атипичные" лировку определенной теории парных сравнений, что предпола-
группы на концах распределения мнений более категоричны в своих гало наличие некоторых содержательных представлений о субъек-
суждениях, чем те, что находятся в середине, и что личностные тивной метрике и субъективных единицах измерения. Принци-
черты представителей "крайних" групп более сходны, чем у пред- пиальной особенностью выведенного Терстоуном закона сравнитель-
ставителей "центра". Последнее соображение близко к более поздней ного суждения была возможность установления субъективной мет-
идее авторитарности (ср. [154]). рики даже при отсутствии физической величины у сравнивав-
Работая над шкалой, Ф.Олпорт обратился к Л.Л.Терстоуну, пси- шихся стимулов. Закон Э.Г.Вебера, послуживший основой для
хологу из Чикагского университета, специализировавшемуся в обла- закона Фехнера, в явной форме вообще не включал в себя
сти психофизики, за консультацией по проблемам психологического субъективных значений стимула, но без предположений о субъек-
измерения. Терстоун занимался проблемами абсолютных и диффе- тивной метрике не мог быть проверен. Идеи Терстоуна были дейст-
ренциальных порогов ощущения и, остро чувствуя кризисное состо- вительно новаторскими, как и использованный им эксперименталь-
яние классической психофизики, пытался найти новые подходы к
измерению сенсорного континуума. Позднее он оценивал пионерские ный метод.
исследования Олпорта как прямой стимул для своих собственных Возвращаясь к просьбе Ф.Олпорта, можно сказать, что круг
работ по шкалированию [149 ]. Заинтересованный идеями Олпорта, интересов Терстоуна к тому времени отчетливо сфокусировался на
Терстоун решил применить к социальным установкам какое-нибудь проблемах субъективной метрики и измерения "социальных ценно-
из новейших средств психофизического арсенала. Задача заключа- стей". Предложение Олпорта вызвало у Терстоуна двоякий интерес.
лась в том, чтобы найти "имманентную" метрику установочного Во-первых, это был еще один шанс "вдохнуть немного жизни и
континуума, шкалу с равными градациями. интереса в психофизику, в которой длительное время доминировали
В арсенале психофизики, уже более полувека занимавшейся тривиальные проблемы поднятия весов и определения порогов". Во-
сопряжением физического ряда стимулов и сенсорного ряда субъек- вторых, "распространение психофизических методов на измерение
тивных восприятий, были достаточно сильные средства косвенного социальных ценностей стало особенно соблазнительным, когда
шкалирования. Одно из лучших и новейших средств - метод парных оказалось, что закон сравнительного суждения полностью независим
сравнений (стимулы попарно сравниваются друг с другом и диспер- от физических величин стимулов" [149. Р.310]. В этих обстоятель-
сия различения служит критерием размещения стимулов по града- ствах, как пишет Терстоун, он в 1928 г. опубликовал статью
циям сенсорного ряда). "Установки могут быть измерены" [229], вызвавшую, вместо ожи-
Метод парных сравнений был усовершенствован Терстоуном и даемого одобрения, "бурю критики и споров". К моменту публика-
восходил к классическому методу "постоянного стимула", использо- ции этой статьи в психометрической лаборатории Терстоуна уже
вавшемуся еще Г.Т.Фехнером, который, с точки зрения идеи парных велись работы по конструированию установочных шкал, исходным
сравнений, оказывался частным случаем с фиксированным уровнем материалом которых служили шкалы Ф.Олпорта. В статье "Установ-
одного из стимулов пары [17 ]. Особенный интерес здесь представляет ки могут быть измерены" Терстоун, описав в общих чертах проце-
то обстоятельство, что, судя по автобиографии ЛЛ.Терстоуна [149. дуру построения интервальной шкалы социальных ценностей с по-
Р.306-307 ], субъективной целью его первых экспериментов, начатых мощью метода парных сравнений, отмечает, что кроме такой "раци-
в Чикаго в 1924 г., была не разработка нового подхода к построению ональной шкалы" существует более простая процедура построения
сенсорных шкал, а желание найти "более интересные стимулы" для установочной шкалы, позволяющей измерять индивидуальные уста-
психофизического эксперимента. Как пишет Терстоун: "Основной новки, и описывает общую логику этой процедуры. Первая публи-
проблемой старомодной психофизики была проблема определения кация конкретной шкалы установок по отношению к "сухому зако-
порога... Едва ли можно было беспокоиться о чем-нибудь более ну", суждения которой были взяты из шкалы Олпорта, относится к
тривиальном. Кого заботит точное определение чьего-то порога при тому же 1928 г. [228 ], но использованные в экспериментальной
взвешивании грузов? Преподавая этот предмет, я чувствовал, что процедуре ранги суждений здесь были преобразованы в данные
мы должны что-то сделать с этим абсурдом, вводя более интересные парных сравнений и шкала строилась на основании закона сравни-
стимулы" [128; 149. Р.307]. Терстоун использовал в первых своих тельного суждения.
экспериментах с парными сравнениями два типа стимулов, действи- В проведенном Терстоуном совместно с Чейвом исследовании,
тельно нетривиальных для традиционной психофизики - преступле- посвященном конструированию шкалы установок по отношению к
церкви, результаты которого были опубликованы в работе "Измере-
20
21
ние установок", вышедшей в 1929 г. [233], использовалась уже и во введении к соответствующей части вышедшего уже после смерти
упрощенная процедура "равнокажущихся интервалов". Причина Терстоуна сборника ранних статей [234. Р.213-214] говорится, что
заключалась в 1ромадной трудоемкости метода парных сравнений. основная неудовлетворенность была связана с сиюминутным и слиш-
Если бы, например, Терстоун и Чейв применили его к имевшемуся ком "прикладным" характером интереса социологов и социальных
у них списку из 130 высказываний о церкви, то каждому из 301 психологов к шкалам установок. Терстоуну же любая "актуаль-
экспертов пришлось бы вынести 8385 отдельных суждений. При ность" и ангажированность ученого казалась несовместимой с цен-
использовании метода равнокажущихся интервалов эксперты сорти- ностями науки. Поэтому он, подводя итог периоду своего интереса
ровали карточки с суждениями по одиннадцати стопкам - от резко к проблемам измерения в социальных науках, весьма пессимистиче-
негативных по отношению к объекту установки (например, к церкви ски оценивает будущее социальной психологии (и социологии) как
или "сухому закону") до крайне благожелательных. При этом рациональной и количественной науки: "Следует поставить вопрос,
непосредственно в инструкции было отражено очень сильное допу- в какой мере развитие молодой науки должно находиться под
щение, касающееся субъективной метрики шкалы, - допущение давлением сиюминутных ведущих проблем. Возможно, главная при-
перцептивного равенства интервалов (фактически процедура сор- чина очень низкого престижа социальной психологии состоит в том,
тировки по субъективно равноудаленным градациям, с точки зрения что многие авторы в этой области явно преследуют личные цели.
предполагаемой способности испытуемого осуществлять прямую Сомнительно, чтобы можно было быть пропагандистом и ученым в
оценку воспринимаемых различий стимулов, очень близка к разра- одной и той же области в одно и то же время. Сходные комментарии
ботанным позднее Стивенсом методам прямого шкалирования в могут быть сделаны применительно ко многим социальным исследо-
психофизике). Наименования давались лишь крайним и средней ваниям. Часто оговаривают, что социальные явления столь сложны,
(нейтральной) градациям. После выявления двойственных (с боль- что сравнительно простые методы наук постарше неприложимы. Этот
шим разбросом относительно медианы) и иррелевантных (т.е. не аргумент, вероятно, ложен... Принципиальная трудность состоит в
измеряющих предполагаемую установку) суждений, оставшиеся том, что эксперты в этой области часто враждебны науке. Они
получали числовое значение по шкале на основании усредненных
оценок экспертов. Результирующая шкала (в случае установок по пытаются описать тотальность ситуации и часто ориентируются, на
отношению к церкви она состояла из 45 суждений) была, конечно, рынок или предстоящие на следующей неделе выборы. Они не
не интервальной в строгом смысле слова, но вместе с тем превосхо- понимают захватывающего интереса открытия некоторого рода ин-
дила ординальный уровень измерения и в среднем диапазоне могла вариантности, которая никогда не покрывает всю целостность любой
считаться шкалой разностей. Удаление или прибавление пункта ситуации" [149. Р.312].
шкалы не меняло значений других пунктов. Помимо явно выраженного мотива, вероятно, присутствовал и
Терстоун и его сотрудники (Ю.Чейв, Х.Смит, Д.Дроба и др.) еще один, с которым было связано раздражение Терстоуна против
выполнили в конце 20-х - начале 30-х годов целую серию исследо- подчеркивания "особой сложности" социальных явлений и невоз-
ваний, посвященных измерению установок. В своей "Автобиогра- можности понять целое. Терстоун воспринимал как неконструктив-
фии" Л.Л.Терстоун отмечает в качестве лучшей работы этого пери- ную и бесплодную ту манеру критической аргументации, в которой
ода серию исследований, посвященных влиянию кинофильмов на велись споры о возможности измерение установок. В небольшом
динамику установок и предвосхитивших многие более поздние рабо- комментарии к статье Нетлера и Голдинга о валидации шкал
ты по изучению эффективности пропаганды [230; 231 ]. установок методом "известных групп", написанном пятнадцать лет
Однако вскоре (в конце 1931 - начале 1932 г.) все работы по спустя, он затронет тему бурных дискуссий по поводу данного им
измерению установок в лаборатории Терстоуна были прекращены. определения установки и возможности и целесообразности измере-
Мотивируя это решение, Терстоун позднее писал: "Была куча ния ее эмоционального компонента, которые были вызваны его
переписки с людьми, заинтересованными в измерении установок, но первыми же работами в этой области: "Я пытался избежать спора
они были заинтересованы в основном отбором установочных шкал (уточняя свою позицию), тогда как лучше было бы игнорировать
по конкретным вопросам для использования на конкретных группах его" [234. Р.321 ]6.
людей. Это представляло очень маленький интерес с точки зрения Метод Терстоуна оказал громадное влияние на социологию и
развития теории (установок). Создание все новых и новых шкал социальную психологию. В конце 20-х и начале 30-х годов начался
казалось непродуктивным и я решил прекратить любые дальнейшие настоящий бум конструирования шкал в терстоуновском стиле (осо-
работы в этом направлении. Незавершенные материалы для еще бенно шкал равнокажущихся интервалов) по таким темам, как
дюжины шкал установок были выброшены в корзину, и я объявил
нежелательной любую дальнейшую работу такого рода в моей
лаборатории. Я хотел расчистить место для работ по развитию 6
Какую-то роль в решении Терстоуна прекратить разработку шкал, видимо, играла и
многофакторного анализа" [149. Р.311-312]. И в "Автобиографии", ситуация в психофизике - проблема постоянных ошибок при использовании метода
равных сенсорных расстояний в. 30-е годы была уже осознана, а основоположник
22 прямого шкалирования С.Стивенс уже с середины 30-х годов подвергал критике идею
отождествления единицы измерения с различающей способностью (равенства " равно
часто замечаемых различий") [48].
война расовые отношения, закон, Бог, профессиональная подготовка трудно рассчитывать на возможность контролируемого измерения
социальных работников, "сухой закон", немцы, американская Кон- ("...трудно вообразить надежные сравнительные суждения, или
ституция, смертная казнь, патриотизм, цензура, коммунизм, конт- удовлетворительные измерения по готовой шкале, получаемые
роль рождаемости, посещение воскресной службы и многие другие
[122 ]. Сам Терстоун не считал, что установки должны измеряться от каменщиков, бизнесменов, итало-американцев, монахов,
только через вербальные индикаторы (мнения) и полагал, что грузчиков или швей" [203. Р.190]). Сомнительна, с точки
реконструированная из декларируемых мнений шкала выражает зрения Раиса, и валидность шкалы при отсутствии случайного
лишь определенный аспект установки. Он отмечал, что мнения могут отбора экспертов, и возможность ее использования для испыту-
расходиться с реальным поведением. Вместе с тем, измеряя установ- емых со слишком низким и слишком высоким образовательным
ки, отражающие то, как респондент хотел бы "подать" себя, мы тоже уровнем.
можем получить достаточно полезную информацию [233. Р.9]. С.Стауффер, диссертация которого (1930 г.) была посвящена
Кроме того, поведение может точно так же служить "фальсифика- сравнению результатов использования терстоуновских шкал и каче-
ции" истинных установок, как и мнения. ственных методов (анализ свободных высказываний), продемонстри-
"Терстоуновский бум" не способствовал, с одной стороны, крити- ровал сходство получаемых оценок, но вместе с тем считал, что
ческому осознанию внутренних ограничений, присущих новому качественный анализ автобиографических высказываний незаменим
подходу (что и вызывало недовольство самого Терстоуна - носителя и для исходной формулировки шкальных высказываний, и для
высокой экспериментальной культуры, сложившейся в психофизи- интерпретации получаемых количественных результатов [220 ]. Сам
ке), и, с другой стороны, препятствовал осознанию того, что эти же Терстоун, с неудовольствием наблюдавший "шкальный" ажиотаж
ограничения связаны не столько с несовершенством самого измере- в социологии начала 30-х, как уже говорилось, прекратил в своей
ния, сколько с тем способом .концептуализации, который ему пред- лаборатории все работы в данном направлении. Несмотря на
шествует. Что влияет на выбор определенного суждения: "Я-образ" скептическое отношение Терстоуна, перешедшего к занятиям фак-
или "Я-концепция" испытуемого? Измеряем ли мы стереотипную торным анализом, его шкалы установок стали классикой, упомина-
«социальную самопрезентацию» или "внутреннюю" субъективную емой практически в любом учебнике по социологическому из-
характеристику, предопределяющую потенциальное поведение? На- мерений).
сколько и в каких ситуациях декларируемое отношение будет сов- Следующим шагом в измерении установок явились сумматорные
падать с "истинным", регулирующим поведение? И будет ли это шкалы Ликерта. В своей диссертации 1932 г. Рэнсис Ликерт
совпадение связано со стремлением сохранить когнитивный баланс предложил альтернативу терстоуновской шкале, исключавшую ис-
(согласовать высказывания и поступки) или с существованием еди- пользование экспертных оценок. В методе "суммированных рангов"
ной "внутренней" установки, относительно которой вербальные и первоначально использовались разные форматы вопросов: от про-
поведенческие индикаторы являются синонимами? стых альтернативных, априорно упорядоченных между полюсами
Таким образом уже первые шаги социологического измерения установки, до измеряющих степень согласия с отдельным высказы-
были осложнены недостаточным осознанием связи между концепту- ванием (с равным числом градаций) [169 ]. Около двух сотен исход-
ализацией и измерением, "стихийностью" измерительных процедур, ных вопросов были затем распределены по тематически различным
которым не предшествовала детальная формулировка принимаемых шкалам (расовая сегрегация, национальные референдумы, отноше-
допущений, без которой невозможна даже косвенная проверка их ние к воинской повинности и т.д.). Дальнейший отбор пунктов
обоснованности. проводился апостериорно, по критерию внутренней согласован-
Критические оценки терстоуновского подхода высказывались, как ности.
уже говорилось, не только Терстоуном. Однако сводились они пре- Этот подход к эмпирической валидации применялся в психомет-
имущественно к подчеркиванию квазиэкспериментального характе- рике и ранее. Ликерт не использовал вычислительно трудоемкую
ра процедуры (вербальные стимулы - реакция выбора) и особого процедуру коррелирования с суммарным баллом (репрезентирую-
характера отбора респондентов, ограничивавшего возможность обоб- щим "общий фактор" теста), а проанализировал "дискриминатив-
щения. ность" пунктов для "крайних групп", выделенных по суммарному
Уже упоминавшийся С.Райс, в 20-е годы много занимавшийся баллу. Ликерт обнаружил высокую корреляцию оценок по своей и
изучением установок (динамика, влияние интервьюера, перцептив- терстоуновской шкале, при большей надежности первой для малого
ная стереотипизация под влиянием ключевых визуальных призна- числа пунктов. Изначально Ликерт использовал P-оценки для срав-
ков), отмечал, что по мере перехода от организованных тесно нения разноформатных вопросов, но затем перешел к единой пяти-
взаимодействующих групп с селекцией (студенты колледжа, члены балльной системе оценок, так как результаты оказались практически
дискуссионного клуба) к естественным и более многочисленным, идентичны. Шкала Ликерта, также восходившая к психометрической
традиции, основывалась на еще менее ясных теоретических предпо-
24 сылках, чем шкала Терстоуна, но была значительно удобнее в
25
массовых обследованиях. Поэтому, хотя дискуссии о сравнительных 4. Традиция Гутмана-Лазарсфельда
достоинствах двух методов продолжались [126; 129], она стала в измерении установки и формирование концепции
широко использоваться и также приобрела "классический" статус7 . качественного измерения
Ликертовская шкала стала частью проекта Г.Мерфи, нацеленного В 1940-е годы перед социологами открылась новая область
на преодоление разрыва между количественными и качественными широкомасштабных количественных исследований установок - воен-
методами [187], но и здесь, как отмечает Дж.Конверс, "матери - ные заказы, финансировавшиеся преимущественно правительством.
алом" для проведения многочасовых тестов и источниками написан- Возник новый тип коллективного междисциплинарного исследова-
ных в свободной форме "автобиографий" были те же студенты-до- тельского проекта. Эмпирические данные были ближе к "реальному
бровольцы [109. Р.74], участвовавшие в повторных почтовых опро- миру", чем к лабораторному эксперименту или вторичному анализу
сах и после окончания колледжа. В реализации проекта Ликерт официальной статистики, и представляли собой источник новых
и Мерфи столкнулись с большим количеством "измерительных" ; фактов, __ допускавших более широкие обобщения при проверке
проблем. Как измерять "контекстуальные" переменные, оказываю- социологических теорий (см.: [109. Р. 131-185]). Кроме того,
щие наибольшее влияние на установку (особенности родительской представители академической науки, перешедшие на время войны в
семьи, "круг чтения", о которых респонденты упоминали в свобод- правительственные организации, получили возможность более
ных "автобиографиях"), как разделить "эффект созревания" и прямых и тесных контактов друг с другом и с пришедшими из сферы
влияние макросоциальных изменений (повлияла ли на уменьшение бизнеса полстерами, уже до войны проводившими национальные
политического радикализма бывших студентов Великая Депрессия опросы общественного мнения (в том числе с такими значительными
или дело в приобретении жизненного опыта и новой ролевой фигурами, как Э.Роупер и Дж.Гэллап). И это сотрудничество было
идентичности)? В написанной по результатам исследования книге полезным для разработки новых подходов по всем проблемам эмпи-
[187 ] этим и другим проблемам планирования неэксперименталь- рической социологии - от выборки до измерения и интерпретации.
ных исследований и измерения было уделено значительное Хотя военный опыт и не привел к возникновению каких-либо
внимание. принципиально новых теоретических подходов, он дал существенные
Проблемы сбора данных, сравнительных достоинств полевых и инновации и в области методов, инструментария и планирования
аудиторных исследований, личного интервью и заполняемого респон- исследований, и в становлении новых форм профессиональной орга-
дентом опросника, учета влияния личности интервьюера в начале низации и коммуникации в эмпирической социологии.
30-х годов привлекли внимание и многих других исследователей, Одной из важнейших новаций в области измерения в этот период
преимущественно ориентированных на прикладную науку (промыш- стали шкалы Л.Гутмана. Гутмановские шкалы достаточно трудоемки
ленная психология и социология). Содержательные же проблемы в конструировании, однако их очевидное для современников преиму-
измерения в этот период воспринимались скорее как "кабинетные" щество заключалось в том, что такая шкала, после соответствующего
тонкости, учет которых обходится дорого и не обещает быстрых перетестирования, могла быть сокращена до 5-6 пунктов и, следова-
результатов. Развитие новых подходов к измерению в социологии тельно, была идеально приспособлена к объему анкет, а кроме того,
тормозилось академическими, университетскими рамками исследо- позволяла упорядочить индивидов на одномерном континууме или,
ваний установок. Отсутствие фондов и доступа к большим выборкам по меньшей мере, добиться хорошей аппроксимации такого упоря-
ограничивало объект исследования "населением колледжей" и не дочения. Идеальная модель шкалограммного анализа предполагает
позволяло проводить крупномасштабные эксперименты для совер- "одномерность" пунктов, т.е. их независимость от любых других
шенствования методики измерения. Поэтому неудивительно, что латентных переменных, кроме интересующего исследователя одно-
основные результаты в области измерения установок в 30-е годы мерного континуума. Это допущение само по себе нуждается в
относились к "психологической" ориентации. Вместе с тем эти годы проверке, критерием и результатом которой и является шкала.
стали периодом становления крупномасштабных выборочных соци- Теоретически обосновать это допущение едва ли возможно, так как
альных обследований, возникновения института опросов обществен- трудно предположить существование набора столь специфических и
ного мнения и все большей заинтересованности практически ориен- изолированных вопросов, которые были бы обращены лишь к одной
тированных социологов и политологов в квантификации (при нали- установке - "мишени". Однако на практике в некоторых, не столь
чии сложившейся системы финансовой поддержки этих исследований уж малочисленных, случаях можно найти множество пунктов, связь
со стороны правительственных и неправительственных организаций которых с интересующим исследователя теоретическим конструктом
[103; 142 ]). Этим двум традициям предстояло слиться, и последствия значительно выше, чем с другими конструктами. Более надежным и
этого слияния оказали существенное и весьма неоднозначное воздей- экономным способом нахождения "шкалируемых установочных об-
ствие на подходы к социологическому измерению. ластей" был бы аналитический подход к измерению, позволяющий
26
построить теоретическую модель измерения, допущения которой

27
7
Именно шкалы Ликерта применялись, например, в работе Т.Адорно и соавт. [67].
будут проверены до сбора данных и конструирования шкалы (иногда, было найти способ выделения "полярных" групп, не зависящий от
скажем, просто через вторичный анализ уже имеющихся результа- изменений словесной формулировки. Общая идея предложенного
тов), а условия, при которых "возмущениями" одномерности можно Гутманом подхода восходила еще к шкалам Олпорта-Хартмана и,
пренебречь, будут специфицированы заранее (более детальное об- более непосредственно, к статье Дэниела Катца (ученика Ф.Олпор-
суждение этой проблемы требует анализа формальных аспектов та), опубликованной в 1944 г. [154]. Из этих работ было известно,
шкалирования установок). Однако в 40-е годы, да и значительно что более крайним позициям на континууме политических мнений
позднее, аналитический подход к измерению еще не сформировался, соответствует большая интенсивность, сила убеждений, чем средне-
и Л.Гутману пришлось идти путем эмпирического (и стихийного) му диапазону.
выявления областей, пригодных для шкалограммного анализа. Гутман и Сачмэн для каждого содержательного вопроса шкалы
Кумулятивная ранговая шкала Гутмана имеет некоторое сходство включали в вопросник еще один, направленный на измерение ин-
со шкалами социальной дистанции Богардуса. Однако Богардус тенсивности. Например: "Насколько сильно Вы это ощущаете?", "В
присваивал ранги различным пунктам априорно (позднее, под вли- какой мере Вы с этим согласны?" (с 3-5 вариантами ответа). Строя
янием работ Терстоуна, он применил экспертную процедуру для совместные распределения ответов типа "содержательный вопрос
определения числа градаций шкалы), а Гутман устанавливал шкаль- -вопрос об интенсивности", они получали U-образные или J-образные
ные значения частично на основании их явного содержания, частич- кривые, отражавшие возрастание интенсивности на полюсах содер-
но - по результатам эмпирических наблюдений, отбирая образующие жательных ответов, т.е. позитивных/негативных реакций на опре-
шкалу вопросы. деленное содержание. Разные совокупности вопросов, т.е. по-разно-
Для совершенной гутмановской шкалы - и при совпадении логики му сформулированные и с разным способом дихотомизации, давали
ответов всех респондентов с логикой, заложенной в шкалу исследо- приблизительно одинаковые кривые. Самая низкорасположенная
вателем, - знание положения (ранга) индивида на шкале позволяет точка кривой определяла "нулевую точку" или "область безразли-
однозначно воссоздать паттерн его ответов, а общий паттерн ответов чия". Респонденты, оказывавшиеся с одной стороны "области .без-
выглядит как параллелограмм. различия", рассматривались как настроенные благожелательно, л с
Порядок пунктов в совершенной шкале определяется их "попу- другой - неблагожелательно (что и позволяло получить устойчивую
лярностью" среди респондентов. оценку доли "сторонников" и "противников" определенного мне-
Возможность построить удовлетворительную шкалу в разработан- ния) . Так как использование такой процедуры в многотемном мас-
ной Гутманом процедуре сильно зависела от двух условий: семанти- штабном опросе затруднительно, сотрудники армейского Исследова-
ческой близости формулировок вопросов при возможности манипу- тельского сектора считали, что она может оказаться полезной для
лирования перегруппировкой категорий ответов. Этот выбор "точек отбора 2-3 вопросов по каждой конкретной проблеме. Однако эта
сечения", в результате которого пункт "скорее хорошо" (или "скорее процедура оценки доли "сторонников" и "противников" имела су-
доволен") мог попасть как в позитивную, так и в негативную часть щественный недостаток, так как была чувствительна лишь к общим,
континуума, был достаточно спорен, если не имел под собой очевид- а не специфическим установкам. "Какова ценность утверждения о
ного содержательного основания. Для облегчения работы по постро- том, что определенная доля населения "за" обязательный призыв
ению шкалограммы использовалась специальная "шкалограммная или сокращение расходов, если не ясно, какое специфическое содер-
доска", которая имела углубления в 100 горизонтальных рядах для жание и при каких условиях подразумевается под "призывом" или
индивидов и 100 вертикальных колонок для категорий ответа. Рас- "сокращением" [109. Р.193]. Поэтому возможности шкалограммного
пределение металлических дробинок в лунках доски соответствовало анализа оказались не слишком привлекательны для полстеров-прак-
ответам респондентов, а возможность манипулирования - положени- тиков. Вместе с тем, они представляли интерес для сторонников
ем респондента и "точками сечения" (т.е. перегруппировкой катего- количественного подхода внутри академической науки. Как отмечает
рий ответа) - позволяла обнаружить шкальный паттерн с минималь- Дж.Конверс, количество статей в ведущих научных журналах, по-
ным числом "ошибок". В целом шкалограммная техника имела священных применению и модификации шкал Л.Гутмана, в первое
несомненные преимущества экономии времени и усилий [222. Р.91- послевоенное десятилетие было достаточно велико. Большая часть
121]. этих работ выполнялась на студенческих и других малых группах,
В рамках шкалограммного анализа был разработан еще один но в некоторых статьях и двух книгах (Э.Кэмпбелл, Дж.Гурин,
методический подход, целью которого было получение устойчивого У.Миллер, 1954; С.Стауффер, 1955) речь идет о крупномасштабных
разбиения выборки массового опроса на "сторонников" и "против- исследованиях.
ников" определенного мнения. Практика опросов общественного Гутмановские процедуры использовались не только для шкалиро-
мнения показывала, что доля респондентов на позитивном и нега- вания установок, но и для физиологических симптомов невроза,
тивном полюсе установочного континуума менялась даже при незна- уровней информированности, "коллективных" шкал группового по-
чительном изменении словесной формулировки вопроса. Необходимо ведения.
28 29
В то же послевоенное десятилетие появились работы, критически вые опросы, часто обращается к анализу мотивов поведения, внут-
оценивающие применимость гутмановской процедуры шкалирова- ренних переменных, определяющих поведение потребителя, исполь-
ния в измерении при проведении массовых опросов. Л.Фестингер зуя теоретические концепции "глубинной психологии" - фрейдов-
указывал на негативное влияние монотонного повторения сходных скую репрессию, адлеровский "комплекс неполноценности", юнгов-
по смыслу вопросов на качество ответов респондента. Было показано, скую интроверсию/экстраверсию. Этот интерес к анализу мотивов
Что несколько пунктов, отобранных для упрощения процедуры из человеческого поведения, соединенный с интересом к квантификации
более длинной шкалы, могут давать иное ранжирование респонден- (оба эти интереса имели "венские" корни), породили уникальный
тов [130]. Л.Гутман и сам осознавал ограничения, присущие его талант к сочетанию качественного и количественного подходов,
методу, - невозможность прямого переноса шкал с одной популяции углубленной психологической интерпретации и аналитических ме-
на другую (или в новую ситуацию) и невозможность построения тодов (см., в частности: [162]).
кумулятивных шкал в очень многих интересных для исследователей Лазарсфельда особенно интересовала проблема валидности субъ-
случаях. ективного измерения. В 30-е годы, когда влияние бихевиоризма было
В силу всех этих ограничений гутмановский подход не получил весьма ощутимо даже в прикладной социологии и психологии, любые
широкого распространения в эмпирической социологии и практике субъективные, интроспективные измерения требовали очень серьез-
опросов общественного мнения. ного обоснования. Попытки интроспективного измерения "мотивов"
В конце войны П.Лазарсфельд, позднее других включившийся в часто подвергались нападкам сторонников "объективного" измере-
работу Исследовательского сектора, развил основные положения ния наблюдаемых поведенческих актов, а попытки выяснить "что
латентно-структурного анализа. Лазарсфельдовская модель впервые люди думают (о том), что они думают" расценивались как едва ли
была опубликована в том же четвертом томе серии "Американский не отступление от научных норм. Лазарсфельд стремился доказать,
солдат", вышедшем в 1950 г. [222]. Лазарсфельд стремился исполь- что измерение субъективных переменных возможно и целесообразно,
зовать идеологию факторного анализа (выведение латентных пере- что люди способны объяснять мотивы своего поведения и мотивы
менных-черт из эмпирического распределения манифестных пере- предпочтений, если возможные смысловые оси такого объяснения
менных, т.е. ответов на совокупность вопросов) таким образом, отчетливо идентифицированы исследователем заранее.
чтобы этот подход мог применяться при низких уровнях измерения Рассматривая проблему сравнимости субъективных измерений,
наблюдаемых переменных. Общая идеология метода достаточно Лазарсфельд высказывает очень оригинальную трактовку проблемы
известна, поэтому мы можем опустить ее изложение. Отметим лишь, общности/идентичности показателей (статья "Искусство спраши-
что латентно-структурный анализ был очень существенным шагом в вать: "Почему ?", 1935 г. [161]): для того, чтобы обеспечить
теории шкалирования, но из-за вычислительных сложностей доволь- идентичность интерпретации респондентами вопроса, нужно стре-
но долго оставался вне сферы активного применения 8. В конкретных миться не к жесткой фиксации словесной формулировки ("стандар-
социологических исследованиях по-прежнему использовались пря- тному стимулу"), а к более свободному способу коммуникации
мые вопросы или (значительно реже) гутмановские или ликертов- интервьюера и респондента, обеспечивающей удовлетворительное
ские шкалы. понимание и единство личностного смысла вопроса для респондентов.
К 1930-м - 1940-м годам относится возникновение еще одной Проблему поиска идентичных показателей в сравнительных иссле-
важной для социологического измерения традиции, более общей, чем дованиях нельзя считать решенной и сегодня, но сама постановка ее
измерение установок. Речь идет об общем подходе к измерению Лазарсфельдом чрезвычайно интересна. В 30-е - 40-е годы идея
субъективных переменных, начало которому положили предвоенные гибкой формулировки вопросов, позволяющей фиксировать опреде-
работы П.Лазарсфельда. ленный личностный смысл, не могла приобрести популярность среди
ученых, проводивших широкомасштабные опросы общественного
Интерес П.Лазарсфельда к измерению латентных, опосредующих мнения и уделявших основное внимание полной стандартизации
психологических переменных восходит к раннему периоду его про- процедур, но она дала толчок к дальнейшей разработке методов
фессиональной деятельности. Защитив в 1925 г. диссертацию по при- фокусированного интервьюирования.
кладной математике в Венском университете, Лазарсфельд сочетал Эта идея повлияла на разработку ПЛазарсфельдом классифика-
преподавание в гимназии с исследовательской работой в Психологи- ционных схем для тематического анализа "сырых" ответов, получа-
ческом институте Венского университета под руководством Шарлотты емых при личной беседе или через открытые вопросы. Четыре
Бюлер, изучавшей фазы жизненного цикла. К этому времени отно- правила классификации, изложенные в [161 ] и позднее, в 1951 г.,
сится его работа о занятости молодежи. воспроизведенные в [167], гласят:
В ранних статьях американского периода Лазарсфельд, активно
включившийся в широкомасштабные исследования рынка и А. Общие категории кодирования должны быть разделены на
массо- специфические категории ("артикуляция").
30 31
8
В конце 60-х и в 70-е - 80-е годы появились новаторские подходы к его применению и
модификации (см., например: [136]).
ми, с помощью разных показателей - наличие собственного дома или
автомобиля, род занятий, уровень доходов и т.п. При этом каждый
Б. Эти категории должны быть исчерпывающими и взаимоисклю- этих показателей будет давать, в определенных пределах,
чающими ("логическая правильность"). одинаковый паттерн связей с другими "психологическими" пе-
В Кодирование должно выделять некоторую органическую струк- ременными. В подтверждение этого тезиса Лазарсфельд приводит
туру, схватывая логику ситуации или исследуемого процесса. некоторые опросные данные (относительная стабильность числа
Г. Оно должно отражать собственную точку зрения респондента голосующих за республиканцев среди "высоких" по экономиче-
или его субъективное определение ситуации. скому статусу групп, выделенных с использованием различных
индикаторов). Хотя Лазасфельд и оговаривает, что нужны дальней-
К этому же периоду (вторая половина 30-х годов) относятся шие проверки взаимозаменяемости переменных, здесь уже
первые попытки применения аналитических типологий для класси- прослеживается важнейший источник теоретической модели латен-
фикации данных из монографических "анализов случая" с последу- тно-структурного анализа. Это - представление о вероятностных
ющим созданием новых переменных, а также использования четы- отношениях манифестных индикаторов и лежащих в их основе
рехклеточных таблиц сопряженности для анализа категориальных неизмеряемых латентных осей.
переменных. Основная схема причинного анализа, детально разра- Как отмечает Дж.Конверс, ПЛазарсфельд и его сотрудники,
ботанная Лазарсфельдом в более поздних работах и основанная на публиковавшиеся в "Journal of APPlied Psychology", постоянно ощу-
создании новых качественных переменных через типологическую щали недостаток данных и показателей и обращались к самым
редукцию и на проверке их статистической связи с помощью четы- разным источникам - опросам книжных клубов, данным опросов
рехклеточных таблиц, была впервые использована в проведенном общественного мнения, проводившихся фирмами Дж.Гэллапа и
ПЛазарсфельдом и С.Стауффером исследовании американской Э.Роупера, к оценкам размеров аудитории газет и журналов и
семьи в период депрессии (1937 г.). Сама идея построения четырех- панелям студентов-радиослушателей. "Можно образно представить
клеточных таблиц принадлежала С.Стауфферу (LaParsfeld oral себе Лазарсфельда и его группу как компанию предприимчивых
history interview // Oral History Collection / Butler Library Columbia старьевщиков, ищущих данные всех форм и размеров и приносящих
University. P.145, цит. по: [109. P.139-140])9. их в свой оффис в коробках, корзинах, ящиках и кувшинах, чтобы
В предвоенные годы ПЛазарсфельд и его сотрудники вели обшир- потом подвергнуть их анализу" [109. Р.142].
ную работу по систематизации существующих и конструированию Мотивом здесь было убеждение в возможности найти теоретиче-
новых индексов. В книге "Радио и печатная страница" [164] обсуж- ские рамки для любых данных и с помощью простых статистических
даются самые разные индексы - индекс "стандарта чтения" (Лазар- и концептуальных процедур (прежде всего, связывающих показатель
сфельд), три индекса установок по отношению к радио (Сэйр), с косвенно измеряемой теоретической переменной) внести смысл в
конструирование индексов из монографических "анализов случая" хаос эмпирии. Дж.Конверс, остроумно перефразируя популярную
(Лазарсфельд и Робинсон), шкала рейтинга популярных песен и песню, говорит: "Когда у Лазарсфельда не было под рукой тех
другие. Например, сводный индекс "стандарта чтения" был сконст- данных, которые он любил, он любил те данные, которые были под
руирован Лазарсфельдом как операциональный эквивалент неизме- рукой" [109. Р.142 ]. Эти усилия были продуктивны, так как откры-
ряемой переменной "читательская способность". Лазарсфельд дихо- вали перед социологией новые перспективы косвенного измерения,
томизировал четыре переменные - образование, экономический ста- пробуждая обоснованный оптимизм сторонников квантификации в
тус, количество чтения (количество читаемых журналов) и уровень социальных науках. И в то же время они подталкивали социологов
чтения (чтение книг в течение последнего месяца) - и суммировал к атеоретическому способу измерения, когда значения показателей
знаки " +" этих переменных, получая шкалу со значениями от О вкупе с элементарными статистическими процедурами становились
до 4. Эта процедура была, безусловно, весьма огрубленной и никак "волшебной машинкой", с помощью которой давалась апостериорная
не учитывала явно существующие причинные отношения между интерпретация полученной " простой структуры" эмпирических по-
переменными. Однако нельзя не оценить усилия, предпринятые для казателей с помощью ad hoc изобретаемых понятий.
квантификации и косвенного измерения существенных переменных Однако сам Лазарсфельд не ограничивался моделью косвенного
теории. измерения с помощью доступных и относительно прямо измеряемых
В 1939 г. Лазарсфельд еще раз обращается к проблеме идентичных показателей типа данных переписи и социальной статистики. Он
индикаторов (статья "Взаимозаменяемость в измерении эконо- упорно стремился к обоснованию прав субъективного измерения в
мических влияний" [163]). Речь здесь идет о том, что переменная социальных науках, считая, что субъективные, но имеющие смыс-
" экономический статус" может быть измерена разными способа- ловое отношение к теоретически существенному конструкту, пока-
затели предпочтительнее любых самых объективных "коррелятов",
32

9 33
По мнению Дж.Платт, С.Стауффер мог, в свою очередь, позаимствовать идею
использования четырехклеточных таблиц у Дж.Юла. В 1931-32 гг. он проходил 3 И.Ф.Девятко
стажировку по статистике в Великобритании и тесно сотрудничал с Р.Фишером, К. и
Э.Пирсонами, А.Баули [197.Р.344].
которые связаны с этим конструктом лишь очень опосредованным суждения". И далее:"... существует прямая логическая линия дви-
образом.
жения от качественной классификации к самым строгим формам
Это сочетание интереса к косвенному и многоиндикаторному измерения через промежуточное использование систематических
измерению с предпочтением субъективных индикаторов промежу- оценок, ранговых шкал, многомерных классификаций, типологий и
точных переменных на первый взгляд кажется парадоксальным количественных индексов" [167. Р.155]. Представления ПЛазар-
(зачем обращаться к интроспекциям и самоотчетам, если "все во сфельда о качественном измерении и предложенные им конкретные
всем" и можно найти пусть очень косвенный, но "объективный"
показатель типа доходов, расходов и бюджета времени?). По сути эвристические приемы построения типологий и задания пространства
же влияние психологии (и в том числе "симптомологии" психоана- признаков сыграли важную роль в решении многих теоретико-мето-
лиза) предопределило чуткость Лазарсфельда к проблемам "пони- дологических и прикладных проблем социологии (см. также: [8 ]) и
мающей" интерпретации и обусловило уникальность его таланта, о расширили существовавшие представления о возможностях внефи-
чем говорилось выше. Дж.Конверс отмечает, что для американской зического измерения.
профессиональной карьеры Лазарсфельда как социолога, его интерес
к психологии оказался значительно более влиятельной частью "вен- 5. Формальные модели шкалирования установок
ского наследства", чем даже его социалистические убеждения [109. и классификации шкал
Р. 143].
Анализ ранних работ Лазарсфельда позволяет понять суть и Описывая историю становления различных подходов к измерению
основное содержание выдвинутой им позднее, в начале 50-х годов, установок в эмпирической социологии, мы не рассматривали сколь-
концепции качественного измерения (наиболее ясно изложенной в нибудь детально формальные модели шкалирования установочных
работах [32; 167]). Фактически идея качественного измерения лишь переменных (хотя и останавливались на некоторых особенностях
подытоживает те взгляды, которые П.Лазарсфельд развивал в пред- процедуры). В принципе, анализу этих формальных моделей и
военные и военные годы, и тот опыт, который он получил в работе проблемам конструирования шкал посвящено очень большое коли-
над "Американским солдатом". чество работ зарубежных и отечественных исследователей (отметим,
Заинтересованность ПЛазарсфельда в качественном измерении в частности, [21; 26; 30; 49; 63; 76; 98; ПО; 210; 237]). Задача
была связана, с одной стороны, с преобладанием в рассматрива - данного раздела заключается в том, чтобы на основе существующих
емый период проблемно-ориентированных, "заказных" конкретных работ дать некоторое общее представление о связи конкретных
социологических исследований, в которых постановка проблемы и процедур с логикой и формальными основаниями различных моделей
возможности получения определенного типа эмпирических данных шкалирования, обобщить различные классификации шкал и указать,
были первичны по отношению к теоретической концептуализации и какое место в этих классификациях занимают описанные нами
построению модели измерения. С другой стороны, методические подходы к шкалированию 11.
проблемы агрегирования, использования множественных индикато- При всем многообразии существующих теоретических подходов
ров и оценки качества измерения были еще недостаточно разрабо- к определению понятия "установка" в социологии и социальной
таны. П.Лазарсфельд формулировал эту проблему, как проблему психологии практически общепринятым является выделение трех
несоответствия между постулируемой из теоретических соображений компонентов (аспектов) аттитюдов - когнитивного, аффективного и
метрикой теоретического конструкта и метрикой доступного инди- поведенческого (конативного). Трем компонентам социальной уста-
катора. В качестве общей он рассматривал следующую тактику новки соответствуют три класса явлений - 1) осознание объекта
качественного измерения: сегментация сложного теоретического по- установки, связанное с наличием определенной информации о нем;
нятия и уточнение (спецификация) отдельных его аспектов; нахож- 2) реальное, предполагаемое или предпочитаемое поведение по
дение индикаторов, соответствующих выделенным аспектам; постро- отношению к объекту; 3) эмоционально-аффективная оценка, выяв-
ение сводного показателя, суммирующего значения отдельных ин- ление чувства симпатии или антипатии по отношению к объекту
дикаторов, исходя из содержательных теоретических соображений 10. установки.
В работе 1951 г. П.Лазарсфельд подчеркивал, что измерение в Исходя из некоторого недетализированного представления о
общественных науках может проводиться самыми разными средст- наличии структурного взаимодействия между перечисленными
вами, "которые менее точны, чем строго количественное измерение, 35
но тем не менее много лучше беспомощного индивидуального
34
11
Необходимо оговорить, что мы не будем рассматривать проблемы многомерного
шкалирования установок, так как с нашей точки зрения эти подходы относятся к иной
традиции, не получившей достаточного внимания в эмпирической социологии и
10
Фактически используемые Лазарсфельдом процедуры - прообраз формальной модели оказавшей на последнюю лишь незначительное влияние. Эта традиция -
аддитивного (одновременного) совместного измерения, основанного на эмпирическом реконструкция субъективных семантических пространств (или систем значений) -
отношении упорядочения зависимой переменной, получаемого из разных комбинаций была заложена прежде всего работами психологов Джорджа Келли и Чарльза Осгуда
нескольких независимых переменных [112. Р.25-26]. [156; 194] и составила основу современной психосемантики (см., например: [58; 59]).
компонентами, рассмотрим общие подходы к измерению когни- росах) шкалы. Соответственно требование функционального единст-
тивных, аффективных и поведенческих переменных социальной ва будет определяться через взаимоотношение судей либо пунк -
установки. тов. Помимо функционального единства выделяют еще две харак-
Рассматривая понятие "переменная" как конструкт, отражающий теристики измерительного инструмента - надежность и валидность.
некоторое качество (свойство), в разной мере присущее всем членам Однако так как эти две характеристики качества измерения явля -
наблюдаемой совокупности, определим здесь измерение как систе- ются предметом рассмотрения в следующей главе книги, здесь мы
матическое приписывание чисел совокупности наблюдений, отража- не будем на них останавливаться.
ющее положение каждого члена совокупности на континууме пере- Рассмотрим вкратце проблему обобщения шкальных значений.
менного качества. Для наших целей шкалу можно определить как Постольку, поскольку исследователь заинтересован в представлении
множество элементов. Каждый элемент шкалы состоит из трех отдельных эмпирических событий в абстрактной модели интересую-
компонентов - а) эмпирическое событие-"стимул"; б) действитель - щей его области, он склонен считать каждое индивидуальное событие
ное число; в) правило, или совокупность правил, связывающих выборкой из универсума наблюдений, любой член которого может
событие с числом. Такое определение восходит к общему определе- заменить текущее наблюдение. Различные переменные, представля-
нию измерения, данному С.Стивенсом [47. С. 19-20; 218. Р.19-24] 12. ющие аспекты данного универсума наблюдений и влияющие на
Получаемая в результате приписывания чисел объектам числовая результат измерения, - это то, что Л.Гутман обозначил как "фасе-
система становится моделью эмпирической системы. При конструи- ты", грани отдельного гипотетического универсума, по отношению
ровании шкалы исследователь специфицирует переменную-свойство, к совокупности которых реальные наблюдения должны рассматри-
в терминах которой могут быть описаны события из множества ваться как выборка [138 ]. Собственно измерению, таким образом,
наблюдаемых событий. Далее он формулирует правила "отображе- предшествует спецификация его объекта с точки зрения интересую-
ния", разметки, согласно которым события могут различаться по их щих исследователя аспектов ("фасет"). Эта спецификация объекта
положению на оси переменной, и, наконец, представляет числами
эти различия событий. В результате исследователь может считать (предметной сферы) зависит от предполагаемой генерализации чис-
измеренной с помощью шкалы переменную-свойство в той мере, в ленных приписываний. Исследователь, таким образом, должен зара-
какой она проявляется в конкретной совокупности наблюдений. Как нее определить желаемый способ генерализации шкальных значений
будет показано далее, общность правил отображения и числовой измеряемой переменной и обеспечить условия для генерализации
системы определяет возможность переноса шкалы за пределы исход- при планировании исследования. Так как любой универсум наблю -
ной совокупности наблюдений. дений заведомо многогранен и для некоторых "фасет", видимо,
Определим понятие "инструмент измерения" как совокупность нельзя задать конечное множество условий, то принимаемое допу-
средств, с помощью которых эмпирические события отображаются в щение о случайном характере выборки из гипотетического универ-
числовую систему. Т.е. инструмент измерения - это вся совокупность сума едва ли может быть строго обосновано. Здесь для наших целей
операций разметки, с помощью которых конструируется шкала. достаточно будет считать выборку наблюдений случайной, если
Так, если значение переменной оценивается через усреднение оце- элементы этой выборки могут рассматриваться как репликации друг
нок экспертов, то инструмент измерения может быть описан как друга. Для любой модели шкалирования обязательна какая-то форма
совокупность повторяющихся оценочных суждений. требования случайного воспроизведения, так как без этого невоз-
Вслед за Г.Апшоу, введем в качестве первой характеристики можно обобщение "численного приписывания". В сущности, обобще-
инструмента измерения требование функционального единства. ние здесь выступает как форма предсказания. Т.е. исследователь
Функциональное единство инструмента измерения - это степень полагает, что сделанное конкретное наблюдение может быть восп-
согласованности, консистентности различных операций разметки в роизведено при наблюдении любой другой выборки из универсума
определении шкального значения конкретного стимула [237. Р.65 ]. наблюдений, определенного на стадии спецификации. В случае
В понятии функционального единства подразумевается существова- неадекватного описания универсума наблюдении обобщение окажется
ние какой-то статистической зависимости между операциями, харак- необоснованным.
тер которой, однако, будет меняться в соответствии с теоретическими Наконец, определим, что подразумевается под моделью шкали-
представлениями о природе измеряемой переменной 13. В области рования. Модель шкалирования определяет способ выведения бал-
измерения установок составляющие инструмент операции могут лов, уровень полученного измерения (тип шкалы) и выбор способов
быть воплощены как в субъектах-судьях, так и в пунктах (воп- оценки функционального единства полученного инструмента изме -
рения (ср. [26. С.129]).
Г.Апшоу, основываясь на трехкомпонентной теории установок и
36
классификации шкал по Торгерсону [235. Р.45-48 ], ввел классифи-
кацию шкал установок [237. Р.69-72 ]. Так как эта классификация
12
очень удобна при обсуждении различных подходов к шкалированию
Более строгий подход к определению шкалы изложен, например, в [30; 42; 49].
13 37
Требование функционального единства частично совпадает с определением одномо-
ментной надежности, но в силу более общего характера оно оказывается весьма удоб-
ным для анализа формальных моделей шкалирования установок.
установок, мы дадим ее краткое описание. Первое различение шкал Таблица 1.1 Классификация шкал установки (по Г.Апшоу)
проводится по типу установочных переменных. При этом перемен-
ная, как уже говорилось, это свойство, по которому упорядочивается Класс наблюдений, Общие типы шкал
для которого уста-
совокупности наблюдений. Так как связанные с установкой навливаются чис- Когнитивные Поведенческие Аффективные
явления могут быть когнитивными, поведенческими и ленные значения
аффективными, то выделяется три общих типа шкал - когнитивные,
поведенческие и аффективные шкалы. Каждому из этих общих типов Субъекты I IV VII
шкал соответствует тип базисного наблюдения, на котором основано Когнитивно- Поведенческо- Аффективно-
построение шкалы. Внутри общих типов шкал конкретные типы субъектные субьектные субъектные
(классы) выделяются в зависимости от того, как обозначен класс шкалы шкалы шкалы
наблюдений, которым собственно и приписываются численные Содержание II V —
значения. В самом общем случае численные значения могут
приписываться субъектам установки, возможным содержаниям Когнитивно-со- Шкалы со-
установки, либо различным объектам установки (см. также [213. Р. держательные держания пове-
шкалы дения
122-123 ]. Получаемая классификация шкал установки схематически
изображена в табл. 1.1. Объекты III VI VIII
Когнитивные шкалы. Когнитивная переменная относится к зна- Когнитивно- Поведенческо- Аффективно-
нию (или информации) субъекта об объекте установки. Базисным объектные объектные объектные
наблюдением для конструирования когнитивной шкалы является шкалы шкалы шкалы
выражение субъектом мнения о характеристиках объекта установки.
Это мнение может быть подвергнуто верификации по правилам, способа действий в проблемных ситуациях, связанных с
которые, однако, могут быть различны для разных людей (прямая объектом установки. Разумеется, поведенческая готовность тесно
проверка, религиозное откровение или что-либо еще). В любом связана с когнитивным и аффективным аспектами установки. Более
случае мнение может быть оценено как верное или ошибочное. того, поведенческие переменные установки могут выступать предик-
Можно привести следующие примеры когнитивных установочных
переменных: субъективно воспринимаемая степень выраженности у торами когнитивных и аффективных переменных. Однако разделе-
объекта установки какой-либо черты, дифференциальная значи- ние этих переменных и, соответственно, шкал полезно не только с
мость различных черт объекта, уверенность, с которой субъекты аналитической точки зрения, так как возможно рассогласование
приписывают черты объекту. Так как любое мнение имеет три компонентов установки (например, "феномен Лапьера"). Поведен-
компонента - разделяющий его субъект, содержание мнения и ческая установочная переменная связана с готовностью человека
объект, к которому оно относится, - то при измерении когнитивной совершать действие, соглашаться с его свершением или поддерживать
переменной шкальные значения могут приписываться наблюдениям, его. Базисным наблюдением для построения шкалы является приня-
соответствующим каждому из этих трех компонентов. Приведем тие или отвержение субъектом действия, направленного на объект.
примеры получающихся типов шкал14, давая описание измеряемой По классу наблюдений, получающих численные значения по шкале,
переменной: можно выделить следующие типы поведенческих шкал - поведенче-
ско-субъектные, шкалы содержания поведения и поведенческо-объ-
I. Когнитивно-субъектная - степень, в которой типичный ектные шкалы. Приведем примеры:
американец, швед, немец воспринимает французов как жизне-
радостных. IV. Поведенческо-субъектные шкалы - насколько типичный
II. Когнитивно-содержательная - степень, в которой типичный бе-
американец воспринимает французов как жизнерадостных, расчет- лый профессионал, независимый предприниматель, наемный рабо-
ливых, предприимчивых и т.д. чий-китаец считает приемлемым вступление в брак с черным аме-
III. Когнитивно-объектная - степень, в которой типичный амери- риканцем.
канец воспринимает французов, англичан, немцев как жизне- V. Шкалы содержания поведения - насколько типичный атеист
радостных. считает приемлемым наказывать торговлю наркотиками смертной
казнью, высылкой из страны, пожизненным заключением и т.д.
Поведенческие шкалы. Поведенческий аспект установки относит- VI. Поведенческо-объектные шкалы - степень, в которой типич-
ся к действиям, которые личность совершает, защищает или ный американский студент колледжа считает возможным вступление
поддерживает. Фактически речь идет о принятии решений и выборе в брак с француженкой, негритянкой, японкой.
39
38

14
Подчеркнуты шкалируемые наблюдения.
Аффективные шкалы. Аффективный (или эмоционально-оценоч- численных значений эмпирическим событиям и требования функ-
ный) компонент установки обычно выражается через степень пред- ционального единства, а также возможность использования модели
почтительности или благожелательности к объекту установки. "Фер- для только что описанных восьми классов шкал установок.
мер и игрок в гольф могут в одинаковой мере ожидать дождя в Как уже отмечалось, эмпирический " субстрат" для конструи-
определенный день, но это общее мнение может вызывать у них рования различных шкал установок практически одинаков. Респон-
противоположные чувства" [237. Р.72]. Т.е. игрок в гольф может дент сообщает исследователю, что он думает, чувствует относительно
иметь неблагожелательную установку по отношению к дождю, а какого-то объекта или как он собирается поступать по отношению к
фермер - благожелательную. Базисным наблюдением для конструи- нему. Различие заключается в том, что исследователь определяет
рования аффективной шкалы является проявление субъектом по как базисное эмпирическое событие, которое должно быть отражено
отношению к объекту установки ориентации "за - против". Эмпи- в числовой системе с отношениями. При этом особую сложность
рическими событиями, которым приписываются числа, могут высту- представляют субъектные шкалы, так как задача здесь заключается
пать субъекты либо объекты установки. Соответственно результатом в том, чтобы получаемая шкала могла служить надежным основани-
будут аффективно-субъектные либо аффективно-объектные шкалы. ем для межиндивидуальных сравнений, быть нечувствительной к
Так как аффект логически может быть определен как унитарное таким источникам вариации, как индивидуальные речевые привычки
понятие, для аффективных переменных нельзя построить шкалу или стандарты оценивания. Именно для построения аффективно-
содержания установок, т.е. для одномерной шкалы аффективной субъектных шкал и были предназначены модели Гутмана, Терстоуна
установочной переменной принимается предположение, что один и Ликерта15.
человек испытывает одну, и только одну степень аффекта по отно- Существенным для дальнейшего изложения является еще одно
шению к объекту установки (хотя он при этом может приписывать различение - между прямым и косвенным (непрямым) шкали-
единичному объекту любое количество черт или принимать любое рованием, введенное Г.Экманом, Л.Сьобергом и Т.Кюннапасом [60 ].
количество способов действий по отношению к одному объекту). На Различие между названными двумя подходами, в сущности, заклю-
первый взгляд, логика этого рассуждения может быть подвергнута чается в принятии или отвержении предположения о способности
критике с точки зрения понятия "амбивалентного аффекта" ("двой- респондента или испытуемого давать прямые численные оценки на
ственного отношения" в обыденном языке). Однако для того, чтобы более высоком, чем номинальный, уровне измерения. При исполь-
определить амбивалентную эмоциональную оценку как переменную, зовании моделей прямого шкалирования в измерении установок
необходимо либо принять, что один респондент имеет несколько задача респондента состоит в том, чтобы численно оценить, какая
"точек расположения" на шкале, либо трактовать объект установки из множества альтернатив наилучшим образом отражает его уста-
как имеющий несколько стимульных значений. В принципе эта новку. Прямое конструирование номинальной шкалы обычно рас-
задача при некоторых условиях разрешима для многомерного шка- сматривается как безусловно обоснованная процедура. Другие же
лирования. Однако наш анализ общих моделей для измерения модели прямого шкалирования в измерении установок нередко вы-
установочных переменных связан с более ранней традицией измере- зывали споры о наличии у респондентов способностей к кванти-
ния установок в социологии. Поэтому здесь речь будет идти об фикации.
измерении унивалентного аффекта. Таким образом, вслед за Г.Ап-
шоу, мы будем говорить лишь о двух классах аффективных шкал, Прямое ординальное шкалирование
примеры которых приведены ниже: Этой модели соответствует ситуация, когда задачей респондента
является ранговое упорядочение совокупности стимулов по некото-
VII. Аффективно-субъектные шкалы - степень, в которой рому свойству. Формальной моделью этой ситуации является коэф-
подросткам, пенсионерам, армейским офицерам нравятся фильмы фициент конкордации М.Кендэлла. Коэффициент Кендэлла позво-
о Рэмбо. ляет оценить согласованность рангов. Он равен 1 при полном согла-
VIII. Аффективно-объектные шкалы - насколько типичному бе- сии респондентов и 0 при полном несогласии [10. С.116-123].
лому жителю американского маленького города нравятся Дж.Буш, Примером реконструирования шкалы при конкордантной модели
С.Хусейн, М.Горбачеъ и т.д. может служить ранжирование 10 респондентами 8 способов действия
по применимости к конкретной ситуации. Результатом будет шкала
Теперь мы можем перейти к рассмотрению общих моделей, "содержания поведения" (behavioral-content). Предполагаемая этой
используемых при измерении установочных переменных, и анализу моделью шкальная гипотеза - консистентность суждений 10 респон-
сложившихся преимущественно в 30-е - 40-е годы подходов к дентов. В случае ее неотвержения полученное ранжирование может
измерению установок (описанных в предыдущем параграфе) с точки
зрения этих общих моделей. Для каждой из общих моделей будет 41
рассмотрена природа ее базисных данных, правила приписывания
40
15
Здесь, как уже говорилось, мы не будем рассматривать подходы к построению субъек-
тных шкал, развивавшиеся в психосемантике, в частности "семантический диф-
ференциал" , репертуарный тест и т.п.
быть обобщено для всей популяции, выборкой из которой риантны в пределах линейного преобразования формы у = а + bх,
являются 10 респондентов. Коэффициент конкордантности является где коэффициент Ъ отражает различие в единицах шкалы, а коэф-
здесь средством оценки степени согласованности ранжировок. Если фициент а - различие в начале отсчета. Если результаты репликаций
каждый респондент давал бы идентичные данные, то общее ранжи- удовлетворяют этому требованию, то усредненные числовые значе-
рование могло бы быть обобщено до универсума наблюдений. ния стимулов образуют новую шкалу, начальная точка и единица
Если согласованность ранговых данных, по гипотезе представ- которой являются усреднением значений этих параметров по всем
ляющих случайные репликации, неабсолютна, то исследователь индивидуальным репликациям (при простом усреднении компонен-
должен предположить либо наличие ошибок респондентов (непра- ты-репликации будут взвешиваться в прямом соответствии с их
вильно понятая инструкция, намеренное искажение, утомление и дисперсиями: больший "вес" получат те репликации, в которых
т.д.), либо неучет других важных аспектов, либо ошибочность границы категорий уже и, соответственно, единицы измерения мень-
своей теоретической концепции, т.е. отсутствие в универсуме наблю- ше, а дисперсии шкальных значений стимулов - больше). Содержа-
дений единичной одномерной ординальной шкалы данной пере- тельная интерпретация единицы и начальной точки шкалы потребо-
менной. вала бы введения предположения об их инвариантности при воспро-
Трудно установить единый критерий для выбора интерпретации изведениях и введения более сильных ограничений, чем соответст-
неполной конкордантности. В любом случае здесь должна учиты- вующие интервальному уровню измерения.
ваться численная величина полученного коэффициента. Низкие Рассматривая повторные процедуры вынесения суждений как
значения скорее свидетельствуют об ошибочности шкальной гипоте- измерительный инструмент [237. Р.65], т.е. средство, с помощью
зы, чем о влиянии ошибок респондентов. Умеренные - о неа- которого множество стимулов отображается на числовую систем'
декватной "разметке" релевантных признаков универсума наблюде- степень согласованности между различными операциями, составля-
ний [237. Р. 75]. ющими в совокупности этот инструмент, можно определить как
Если исследователь склонен принять предположение о наличии функциональное единство инструмента. В модели прямого интер-
"ошибок ответа", то он либо исключит ошибающихся респондентов вального шкалирования требование функционального единства пред-
(если сможет их идентифицировать), либо воспользуется усреднен- полагает линейные отношения между всеми парами предполагаемых
ными оценками для получения ранга каждого стимула и обобщит повторений. При выполнении этого требования несистематический
полученное ранжирование на универсум наблюдений. разброс в численных значениях, который не относится к линейному
отношению, может рассматриваться как устанавливающий перцеп-
Прямое интервальное шкалирование: тивную ошибку респондента либо по отношению к положению
категориальные шкалы отдельного стимула, либо по отношению к численным значениям
Эта процедура является очень типичной для измерения установок границ категорий. При предположении, что такие несистематические
и позволяет получить категориальную шкалу. Процедурой шкали- ошибки будут взаимоуничтожаться при усреднении, оценкой истин-
рования в этом случае является метод равнокажущихся интервалов. ного значения будет усреднение численных оценок респондентов по
Оценочные суждения осуществляются как приписывание чисел объ- каждому стимулу. Однако наличие линейной связи между парами
ектам через отнесение к категориям, границы которых равнораспо- репликаций, необходимое для выполнения требования функциональ-
ложены по отношению к количеству определенного свойства (пере- ного единства, недостаточно для доказательства того, что полученная
менной). Модель поведения респондента, предполагаемая этой про- шкала обладает инвариантностью интервального типа шкал. Оно
цедурой, заключается в следующем: респондент принимает решение, лишь доказывает сходство категориальных суждений респондентов.
что стимул имеет больше данного свойства, чем нижняя граница Интервальный же уровень измерения требует еще и постоянства
категории, и меньше, чем верхняя граница. В модели прямого единицы шкал. Так как последняя проблема возникает и при
шкалирования категориальную шкалу должен сконструировать сам использовании закона категориального суждения, мы обратимся к ее
респондент. Начало шкалы соотносится со стимулом (возможно, детальному анализу ниже.
гипотетическим), который должен быть отнесен к категории 0. Допущение о равенстве различительных дисперсий, делающее
Единица шкалы обозначает то количество шкалируемого свойства, возможным их использование в качестве единиц измерения на
которое определяет ширину категории ответа. Еще одним предполо- психофизической шкале, явилось предметом концептуальной крити-
жением модели прямого шкалирования является инвариантность ки со стороны С.Стивенса, предложившего альтернативную парадиг-
параметров шкалы при повторении (для новой выборки респондентов му прямого шкалирования отношений в психофизике [48 ]. Работы
или тех же респондентов): численные значения для каждого стимула С.Стивенса и его последователей показали, что для прототетических
могут быть усреднены. психологических континуумов прямое шкалирование отношений
является обоснованной и дающей согласованные результаты проце-
Чтобы совокупность чисел могла рассматриваться как численные дурой (что было подтверждено экспериментами с кросс-модальной
значения свойства на интервальной шкале, они должны быть инва-
43
42
валидацией и сменой стимульного контекста). В основании прямого Pij - нормированное отклонение, соответствующее наблюдаемой
шкалирования лежит модель прямой оценки субъектом величины
стимула. Хотя кросс-модальная валидация неприменима к не имею- доле суждений " i > j”;
щим физической измеримости стимулам, Стивенсу удалось полу- σ i и σ j - различительные дисперсии стимула i и границы
чить некоторые непрямые доказательства существования степенно- категории j;
го закона для ряда социальных переменных, измеряющих аффектив- r ij - коэффициент корреляции между границей категории j и
ный компонент установки (см.: [48]). Однако методы прямого
конструирования шкал отношений, резко изменившие облик психо- стимулом i .
физики в 40-е - 50-е годы, не оказали заметного воздействия на Очевидно, что закон категориального суждения аналогичен зако-
складывавшиеся в социологии подходы к измерению установок. В ну сравнительного суждения, однако второй из сравниваемых сти-
60-е годы появились немногочисленные, но крайне интересные ра- мулов здесь заменен на границу категории. Поэтому для решения
боты в этой области, обзор которых можно найти в [140]. основного уравнения вводится аналогичная совокупность допуще-
ний. Среди обсуждаемых Торгерсоном допущений, нужных для
Косвенное интервальное шкалирование и шкалы, нахождения решений, содержатся следующие три:
основанные на законе категориального суждения 1. Различительные дисперсии всех стимулов равны.
Общая форма закона категориального суждения была описана 2. Различительные дисперсии всех категориальных границ равны.
У.Торгерсоном [235 ]. Исходным для развития процедур шкалирова- 3. Все коэффициенты корреляции между стимулами и границами
ния, основанных на этом законе, был метод последовательных категорий равны.
интервалов, предложенный в 1937 г. М.Сэффиром [207]. Различные При принятии этих допущений, закон категориального суждения
процедуры для получения шкальных оценок и границ категорий может быть приведен к:
описаны М.Сэффиром, А.Эдвардсом и другими16. S i  C j  z ij k 1  k 2  k 3  z ij k (1.2)
При конструировании шкал, основанных на законе категориаль- Особая совокупность допущений используется при применении
ного суждения, перед респондентом ставится задача отнесения объ- предложенного М.Сэффиром метода последовательных интервалов:
екта в наиболее подходящую категорию на континууме предпочита- различительные дисперсии всех границ категорий принимаются
емости. равными, а корреляция между положением на шкале любого стимула
В отличие от модели прямого шкалирования, предположение о и любой границей категории равна нулю [237. Р.87 ]. Тогда уравне-
способности респондента устанавливать равноотстоящие категории ние принимает вид:
здесь не вводится, но шкальный порядок категорий должен быть
известен и явно задан наименованиями категорий. Границы между S i  C j  z ij k   2j (1.3)
категориями ответа рассматриваются как стандартные стимулы: как
и в законе сравнительного суждения, величина процесса различения, Третья из анализируемых Торгерсоном возможностей решения
вызываемого каждым стимулом и каждой границей категории, пред- аналогична второй: различительные дисперсии всех стимулов равны,
полагается нормально распределенной. Выводя закон категориального а корреляции между стимулами и границами категорий равны нулю
суждения, Торгерсон фактически предполагает, что процедура (процедура подробно описана в [21. Р.257-261 ]). Тогда закон кате-
вынесения категориального суждения здесь основана на неявном гориального суждения принимает вид:
парном сравнении "стимул - граница категории".
Закон категориального суждения может быть представлен следу- S i  C j  z ij  i2  k (1.4)
ющим образом: При анализе данных согласно закону категориального суждения
S i  C j  z ij  i2   2j  2rij  i  (1.1) строится матрица Р, элемент которой р ij - частота помещения
j

где S i - среднее гипотетического распределения перцептивного стимула i ниже границы категории j . Так, стимул, помещенный
процесса для стимула i ; в категорию 2, содержит меньшее количество предполагаемого каче-
ства, чем граница между категориями 2 и 3, граница между катего -
Сj - среднее гипотетического распределения перцептивного про- риями 3 и 4 и так далее. Матрица P получается при представлении
цесса для j-ой категориальной границы; всех р.. в единицах единичного нормального отклонения (табл. 1.2).
44 45

16
Подробное обсуждение содержится, например, в [21; 30; 237].
Таблица 1.2а. Матрица Р. Накопленные частоты суждений
"стимул / меньше границы категории f Отрицательный результат проверки внутренней согласованности
свидетельствует о необоснованности по крайней мере одного из
Стимул Границы категорий сделанных допущений. В этом случае можно либо попытаться ис-
ы пользовать новую совокупность предположений, либо отвергнуть
1 2 3 … j … n
гипотезу об одномерности и обратиться к процедурам многомерного
1 P11 Р 12 Р13 … Р1j … 1.00
шкалирования.
2 P21 P22 P23 … P2j … 1 00 Существуют некоторые эмпирические доказательства инвариан-
… Р 3j … тности шкальных значений, полученных на одной выборке. П.Джо-
3 P31 P 32 P 33 1.00 унс [153 ] предлагал двум выборкам респондентов (из одной совокуп-
.
P i1 P i2 … … ности) оценивать один и тот же набор стимулов по 6- и 9-балльной
i P i3 P ij 1.00
.
….
шкале соответственно. Полученные шкалы, относившиеся к классу
Р mj …
m P m1 P m2 P m3 . 1 00 "аффективно-объектных", оказались линейно связаны. Более того,
различительная дисперсия стимулов, оцененная для двух групп,
Таблица 1.26. Матрица P. Единичные нормальные отклонения, соответствующие Р.. оказалась одинаковой. Кроме того, были найдены доказательства
инвариантности измеренной широты категорий.
Основным критическим аргументом, относящимся к категориаль-
Стимул Границы категорий ным шкалам и методам, основанным на законе категориального
ы суждения, является указание на влияние специфических черт "су-
1 2 3 … j … n
дейской группы" на выносимые суждения. В исследованиях Э.Хин-
1 Z11 Z 12 Z 13 … Z1j … 1.00 кли, П.Ферпосона и других (см.: [21. С.262-264]) доказывалось
2 Z21 Z22 Z23 … Z2j … 1 00 отсутствие влияния установок судей на результирующую шкалу.
… Z 3j … Однако и эти исследования были подвергнуты критике за специфи-
3 Z31 Z 32 Z 33 1.00 ческую процедуру исключения "легкомысленных" судей. В любом
.
… … случае, оценивая шкалы, основанные на атрибутировании стимула к
i Z i1 Z i2 Z i3 Z ij 1.00 категории, нельзя забывать об известных из психосемантики и
.
Zm1 …. Z mj … психофизики закономерностях, в частности о зависимости " экстре-
m Z m2 Z m3 . 1 00
m1 мальности" оценок от субъективной значимости стимулов. Этих
недостатков в значительной мере лишен метод парных сравнений,
однако он труднее в применении. В целом накопленные доказатель-
Каждая z ij предполагается выраженной в единицах, зависящих от ства свидетельствуют о том, что прямое интервальное шкалирование
используемой формы закона категориального суждения. Для и, соответственно, метод равнокажущихся интервалов не дают ин-
уравнения (1.2) различные единицы предполагаются равными, а тервальной шкалы, позволяя говорить лишь об ординальном уровне,
для уравнений (1.3) и (1.4) равными предполагаются единицы тогда как методы, основанные на законе категориального суждения,
для каждого ряда и каждого столбца соответственно. Описание имеют некоторые преимущества. Это, во-первых, возможность про-
вычислительных процедур для получения шкальных оценок верки шкальных гипотез, т.е. принимаемой совокупности допуще-
стимулов и границ категорий дано Торгерсоном [235], Эдвард- ний, и, во-вторых, линейная связь шкальных значений, полученных
сом [125] и др. по этой модели, со значениями, полученными в соответствии с
Эдварде и Терстоун предложили вычислять разницу между под- законом сравнительного суждения. Таким образом, модели, основан-
считанными из параметров модели долями рц и наблюдаемыми ные на законе категориального суждения, могут обеспечивать интер-
вальный уровень измерения17.
долями [21. С.258]. Эта процедура может рассматриваться как Описанные нами прямые и косвенные процедуры построения
критерий функционального единства шкалы. Гилфорд предложил шкал непосредственно предназначены для измерения объектов и
использовать хи-квадрат Мостеллера для оценки статистической содержания установок. Однако основной интерес для нас представ-
значимости величины расхождений [237. Р.89]. Однако Торгерсон ляют шкалы, измеряющие различия между субъектами установок,
отметил, что для любого из стимулов доля случаев, когда он будет т.е. - между людьми, придерживающимися определенных мнений,
оцениваться как больший, чем какая-то из границ категории, не имеющих определенные "готовности к действию" и аффективные
будет независимой от доли случаев, когда он будет оценен как ориентации. Именно к этому типу шкал установок относятся шкалы
больший, чем любая другая граница категории. Появляющаяся в Терстоуна, Ликерта, Гутмана, история возникновения которых опи-
результате зависимость противоречит предположениям, лежащим в
основе теста хи-квадрат. 47

46
17
Другая точка зрения обосновывается в [30. С.8О].
сана в первом разделе данной главы. Поэтому мы вкратце рассмот-
рим особенности этих шкал с точки зрения лежащих в их основе
моделей измерения установок.
С данной точки зрения, шкала Терстоуна представляет собой
двухшаговую процедуру построения аффективно-субъектной шкалы.
В принципе она может применяться и для построения когнитивно-
субъектной и поведенческо-субъектной шкал. Первый шаг этой
процедуры соответствует модели прямого интервального
шкалирования (см. выше) - каждое суждение получает значение на
"аффективном" континууме в зависимости от эмоционального
отношения к объекту установки. На втором шаге суждения шкалы
предъявляются выборке респондентов, чье аффективное отношение
к объекту установки должно быть измерено. Респондент
соглашается либо не соглашается с отдельными суждениями.
Окончательный балл респондента - это усредненное значение Рис. 1. Разброс индексов сходства для релевантных и иррелевантных суждений шкалы
(средняя или медиана) баллов всех одобренных им суждений. В Терстоуна.
результате респонденты оказываются размещенными на той же
шкале "за - против", что и предъявлявшиеся им суждения. Т.е. и Э.Чейва [233. Р.45-55]). Очевидно, что для применения критерия
субъектам "присваиваются значения так, как если бы они были иррелевантности нужна еще одна выборка, т.е. группа респондентов,
объектами в когнитивно-объектной шкале" [237. Р.91 ]. не участвовавших в "судейской" процедуре. Критерий иррелевант-
При конструировании терстоуновской шкалы установок важно ности сравнительно редко применялся при конструировании шкал
соблюсти ряд требований, которые были сформулированы преиму- такого типа. Не вполне ясно, насколько этот критерий, явно наце-
щественно самим Терстоуном [233]. В исходном наборе суждений ленный на исключение суждений, "загрязненных" другими конно-
должны быть представлены суждения, соответствующие всем града- тациями, помимо собственно аффективной оценки объекта, важен
циям предполагаемого аффективного отношения, а аффективная для измерения установок. Однако заслуживает внимания аргумент
"нагрузка" суждений должна быть достаточно очевидной. Терстоун Г.Апшоу: систематическое исключение суждений по такому крите-
также считал существенным, чтобы суждения выражали эмоцио- рию иррелевантности может ввести систематическое выборочное
нальное переживание, а не некоторый факт, отношение к которому смещение в отбор из гипотетического универсума недвусмысленно
может определяться чем-то, помимо установок респондента ("В эмоционально-положительных ("за") и эмоционально-отрицатель-
США преобладают представители христианских конфессий"). Для ных ("против") суждений [237. Р.93].
окончательного отбора суждений в шкалу Терстоун использовал Как уже говорилось выше, терстоуновская модель категориальной
следующие критерии: 1) совокупность суждений должна "покры- шкалы не дает интервального уровня измерения. Вероятно, Терстоун
вать" весь предполагаемый континуум аффективного отношения, в 30-е годы был очень близок к формулировке закона категориаль-
будучи достаточно равномерно распределена по нему; 2) отобранные ного суждения и соответствующей модели шкалирования, однако
суждения не должны быть двусмысленными и неясными, т.е. разброс описанные нами ранее (см. раздел 3 данной главы) обстоятельства
суждений судей должен быть невелик (в качестве объективного привели к отказу от дальнейшей работы в этом направлении.
критерия использовался межквартильный размах оценок, который Что же касается требования функционального единства, то в
для суждений в оригинальной шкале установок по отношению к данном случае оно подразумевает линейную связь категориальных
церкви в среднем был равен 1,75; 3) должны быть исключены все суждений любой пары судей. Многочисленные исследования, связан-
иррелевантные суждения. При этом объективный критерий ирреле- ные с возможностью переноса шкальных значений, полученных на
вантности включал в себя процедуру определения индекса сходства "судейской" выборке, на более широкие совокупности, подтвердили,
для всех пар суждений, основанного на наблюденной совместной что это требование удовлетворяется [21. С.262-264; 237. Р.94].
вероятности одобрения пары суждений. Релевантными считались те Как уже говорилось выше, данная процедура построения шкалы
суждения, которые имеют высокий индекс сходства для близких по может применяться и для создания когнитивно-субъектных и пове-
шкальному значению суждений, и низкий - для "далеких". Ирреле- денческо-субъектных шкал установок. Полученные шкалы будут
вантными оказывались суждения, имевшие противоположный пат- отражать соответственно степень готовности приписывать характе-
терн отношений. На рис.1 схематически показаны паттерны разброса ристики объекту установки или склонность предпринимать опреде-
индексов сходства для вымышленных релевантного и иррелевантного ленные действия по отношению к нему.
суждений (конкретные примеры приведены в книге Л.Л.Терстоуна Предложенный Р.Ликертом метод суммарных рангов, позволяю-
щий получать аффективно-субъектные шкалы, как уже отмечалось,
48 в отличие от терстоуновской процедуры не требует проведения
отдельной экспертной процедуры, хотя также предполагает состав-
ление исходного "банка" суждений, касающихся объекта установки.
49
Так как первоначальный вариант метода описан нами ранее, оста- предположить существование функции "весов" суждений и "весов"
новимся лишь на общих чертах его применения. Исключение "не- категорий ответа (возможно, неаддитивной), которая задавала бы
согласованных" суждений осуществляется по результатам примене- точное значение аффективной ориентации каждого респондента по
ния исходного полного списка в группе респондентов, которая ис- отношению к объекту установки. Однако в ликертовской процедуре
пользуется здесь как некий аналог "выборки стандартизации". Для пункты суждения принимаются равными по предполагаемой "эф-
отбора применяются критерии, типичные для психометрического фективности". Т.е. сама процедура оказывается основанной на пред-
"анализа пунктов", - корреляция с суммарным баллом и выявление положении, что "эффективность" одинакова для всех суждений в
вопросов, статистически значимо различающих респондентов "высо- данной совокупности. Это допущение является необходимым, так как
кой" и "низкой" групп (отобранных по суммарному баллу). в противном случае интерпретация результатов становится неопре-
При измерении аффективного компонента установки респонден- деленной. Предположим, что одно из суждений выражэет крайнюю
ты обычно получают инструкцию выбрать для каждого суждения благожелательность по отношению к объекту установки, а другое
одну из пяти категорий ответа: от "совершенно согласен" до "совер- -скорее нейтральное отношение. Чтобы суммирование по этим двум
шенно не согласен". Веса категорий отражают интенсивность согла- пунктам поддавалось осмысленной интерпретации, вес, приписыва-
сия с суждением, выражающим благоприятную установку, или емый категории "совершенно согласен" для "нейтрального" сужде-
несогласия с суждением, отражающим неблагоприятную установку. ния, должен был бы совпадать приблизительно с серединой ряда
Т.е. вес "5" может быть приписан категории, выражающей макси- значений, присваиваемых категориям ответа по первому, "аффек-
мальное согласие с "за"-суждением, а вес "О" - категории, выража- тивному" суждению. Однако модель Ликерта не предполагает какой-
ющей максимальное несогласие с этим суждением. В результате либо оценки суждений, помимо оценки их обобщенной благожела-
каждый респондент получит балл, соответствующий сумме числен- тельности - неблагожелательности по отношению к объекту установ-
ных значений своих ответов. ки. Г.Апшоу, критикуя эту модель, ссылается на данные Л.Ферпо-
Особые и требующие специальных предосторожностей черты сона, показавшего, что процедура "анализа пунктов", применяемая
ликертовской процедуры являются побочным следствием ее простоты при конструировании шкалы Ликерта, ведет к исключению сужде-
и экономичности. Во-первых, предполагается, что баллы, получае- ний, которые не выражают крайние полюса эмоциональной оценки
мые респондентами на основании согласия или несогласия с сужде- объекта установки. Фергюсон исследовании 1941 г. предъявлял уже
ниями, представительны по отношению к гипотетической популяции прошедшие отбор суждения ликертовской шкалы судейской группе,
всех благоприятных и неблагоприятных суждений. Однако ликертов- члены которой ранжировали их по степени подразумеваемого аф-
ская процедура не содержит никаких специальных средств, обеспе- фекта (т.е. аналогично процедуре Терстоуна). Для четырех из пяти
чивающих репрезентативный отбор суждений из этой популяции. объектов установки суждения ликертовской шкалы сгруппировались
Так, здесь нет никакой "судейской" оценки, позволяющей, как в у полюсов континуума "за" - "против" [129].
терстоуновской процедуре, оценить "аффективную нагрузку" и Сам Г.Апшоу продемонстрировал зависимость "выживания" суж-
двусмысленность вопросов шкалы. Во-вторых, пункты, отобранные дений при отборе от их экстремальности следующим образом: исход-
в результате анализа внутренней согласованности, это те, на которые ная совокупность суждений была получена от репрезентативной
респонденты исходной выборки реагировали согласованно. Т.е. отбор выборки респондентов, которых просили описать позиции, соответ-
пунктов ведет к повышению функционального единства окончатель- ствующие крайним градациям шкалы "за - против". Из описаний и
ного инструмента. Однако степень функционального единства зави- был составлен список из 18 суждений. Семнадцать из этих суждений
сит от сходства, гомогенности критериев, которые используют ре- при использовании на других выборках из той же популяции ока-
спонденты, входящие в конкретную выборку, при принятии или зались дискриминативными для высоких и низких баллов на 5-про-
отвержении суждений. Функциональное единство, обеспечиваемое центном уровне.
данной процедурой "анализа пунктов", предполагает, что респон- Как справедливо указывает Б.Грин, математическая модель,
денты пользуются качественно одним и тем же критерием принятия подразумеваемая техникой присвоения баллов респонденту по мето-
решения, отличающим респондентов друг от друга лишь по степени. ду Ликерта, - это модель единого общего фактора [21. С.265-267].
Т.е. вопрос о том, сохраняется ли функциональное единство инстру- Внутренняя корреляция пунктов - результат действия единого обще-
мента при переносе на другую выборку респондентов, оказывается го фактора. При фиксированном уровне этого фактора (аффектив-
связанным с общностью используемого респондентами критерия ного компонента установки) пункты окажутся независимыми. Это,
принятия или отвержения суждений (ср. [241. Р.116]). В-третьих, по сути, та же модель, с которой работают факторный и латентно-
баллы, приписываемые категориям реакции в модели Ликерта, структурный анализ. Идеальная линейная корреляция между общим
отражают интенсивность согласия-несогласия с суждением. Но если баллом и латентным общим фактором достигается, когда "длина"
предположить, что каждое суждение имеет собственную "аффектив- списка суждений стремится к бесконечности. Самым прямым спосо-
ную нагрузку" по отношению к объекту установки, то можно бом верификации модели общего фактора является, видимо, фак-
50 4* 51
торный анализ пунктов шкалы18. Основные источники по проблеме Модель шкалограммного анализа предполагает, что суждения
"взвешивания" пунктов перечислены в статье Б.Грина [21 ], однако выражены в форме, которая логически позволяет определить
мы здесь не будем останавливаться на их анализе, так как они вероятность принятия суждения как монотонно возрастающую или
принадлежат преимущественно к психометрической традиции и не монотонно убывающую функцию шкальной позиции респондента.
оказали заметного влияния на конструирование ликертовских шкал Т. е. речь идет о шкалировании монотонных признаков в термино-
в социологии. В случае следования ликертовской технике присвоения логии К.Кумбса (Терстоун говорил в этой связи о шкалах возраста-
баллов может быть получен ординальный уровень измерения. По ющей вероятности, которым противостоят шкалы максимальной
мнению Б.Грина, шкала ликертовского типа имеет метрику в том вероятности [233 ]; Стауффер - о кумулятивных шкалах, отличаю-
смысле, что для данной совокупности пунктов можно получить щихся от дифференциальных [222. Р. 3-45]). Как уже отмечалось,
распределение баллов в генеральной совокупности. Различие между сама идея шкалирования кумулятивных признаков явно присутст-
баллами будет отражать пропорции людей, имеющих соответствую- вовала уже в шкалах социальной дистанции Боргадуса. Однако
щие оценки [21. С.267]. формальный метод шкалирования был разработан впервые Гутма-
Шкалограммный анализ Гутмана, как уже говорилось при опи- ном. Согласно модели шкалограммного анализа, признаки-пункты
сании истории его разработки (см. раздел 4), применялся к измере- могут быть расположены вдоль континуума переменного качества.
нию когнитивно-, поведенческо- и аффективно-субъектных пере- Исходным и самым простым случаем для модели является дихо-
менных. Результирующая шкала является ординальной. Основания томический признак-пункт (высказывания, имеющие несколько ка-
шкалограммного анализа изложены Гутманом в работе [222. Р.60- тегорий ответа, можно рассматривать как совокупность нескольких
90 ]. Конструирование шкалы начинается со спецификации "универ- высказываний-категорий). Упорядочение пунктов на кумулятивной
сума признаков" ("universe of attributes" по Гутману). Специфика- шкале таково, что респондент, позитивно прореагировавший на
ция заключается в отборе тех манифестаций когнитивной, аффек- некий пункт, будет также позитивно реагировать на все пункты,
тивной или поведенческой переменной, которые можно считать имеющие более низкий ранг. Соответственно респонденты распола-
основными, решающими при предполагаемом обобщении шкальных гаются в зависимости от ранга избранных ими пунктов. Проиллюст-
значений. Если пункты шкалы можно считать случайной выборкой рируем это с помощью гипотетической гутмановской шкалы для
из популяции пунктов, воплощающих самые существенные аспекты шести респондентов и пяти пунктов-суждений, которая изображена
универсума признаков, а респонденты представляют собой случай- на рис.2.
ную выборку из известной совокупности, то реакция выборки ре- Возрастание переменной = свойства -------»-
спондентов по отношению к выборке пунктов может быть обобщена R1 I1 R2 I2 R3 I3 R4 I4 R5 I5
для обеих совокупностей. Если, как и в случае с ликертовской
шкалой, предположить, что каждый индивидуум имеет внутренний Рис.2. Гипотетическая шкала Гутмана для 5 пунктов и 6 респондентов.
критерий, в соответствии с которым он принимает или отвергает
какое-то суждение (выражающее мнение, предполагаемый способ Пять дихотомических пунктов (т.е. суждений с двумя возможны-
действия или эмоциональную оценку), то совокупность респондентов ми категориями ответа) обозначены точками /j , /2 ... 1$. Шесть
и совокупность суждений могут быть совместно логически респондентов, соответственно, представлены точками RI , R2 ... R,.
упорядочены на шкале Гутмана тогда, когда все респонденты исполь- Расположение каждой точки соответствует количеству переменной-
зуют одно критериальное качество (количественно варьирующее), свойства (эмоциональной установки, соматоневротической симпто-
принимая решение согласиться или не согласиться с каждым пунктом матики и т.д.). Количество шкалируемого свойства, соответствующее
опросника. Г.Апшоу приводит пример с вопросом о целесообразности локализации данного пункта /„, - это граница между двумя катего-
вмешательства американских вооруженных сил в конфликт на ази- риями ответа по данному пункту. Таким образом, положительный
атском континенте. Респондент может оценивать этот вопрос с точки ответ определяет некоторую область с одной стороны шкального
зрения последствий этого для геополитической позиции США. Дру- расположения пункта, а отрицательный - область с другой стороны.
гой же респондент, выбирая между "да" и "нет", может оценивать Локализация респондента зависит от той величины переменной-
суждение с точки зрения принесения человеческих жертв ради свойства, которая соответствует его критерию принятия решения о
политических целей. Когда же оба респондента руководствуются согласии или несогласии с суждением. Образно говоря, критерий
одним и тем же свойством суждения, они могут отличаться с точки "резонирует" на некоторое минимальное или максимальное порого-
зрения "нагруженное™" данного суждения этим качеством, которая вое значение вербализуемой в вопросе установки. Так, в ситуации,
требуется, чтобы каждый из них согласился с суждением. изображенной на рис.2, респондент будет соглашаться с любым
52 пунктом-суждением, имеющим меньшее количество заданного свой-
ства, чем его требует его критерий, и отвергать остальные. Следова-
53
18
Следует при этом помнить, что факторный анализ не доказывает аксиому
локальной независимости, а подразумевает ее выполнение.
тельно, число принятых респондентом пунктов-суждений действи- абсолютной (совершенной) гутмановской школы предполагает нали-
тельно будет функцией его положения на шкале: респондент jRt не чие взаимосвязи между пунктами-суждениями шкалы. Условная
вероятность события "респондент согласится с пунктом Im ", если
он
согласился с пунктом, имеющим более высокое положение по шкале,
например / , равна единице. Для реальных данных, из-за оши -
бок измерения и/или неполного соответствия модели, рассчитанные
значения этой условной вероятности будут меньше единицы. Воз-
можна и ситуация, когда не выполняется предположение об одно-
мерности, и респонденты реагируют на суждения шкалы, исходя из
каких-то других свойств (критериев). (Самый яркий пример приве-
ден в работе [241. Р. 109-114], содержащей достаточно типичную
критику гутмановского подхода и понятия "ошибки": некто может
ответить отрицательно на все вопросы шкалы социальной дистанции,
согласится ни с одним пунктом, а респондент R, одобрит все пять. но вместе с тем - дать позитивный ответ на вопрос: "Согласны ли
Связь между гутмановской шкалой и шкалограммной матрицей Вы, чтобы Ваша дочь вышла замуж за негра?", не потому, что он
может быть прояснена с помощью табл. 1.3, которая эквивалентна "ошибся", а потому, что он равно не выносит негров и собственную
Рис.2: дочь.) В любом случае, если считать, что пункты и респонденты не
могут быть упорядочены на единой шкале, нужно принять альтер-
Таблица 1.3. Шкалограммная матрица, иллюстрирующая паттерн ответов нативную гипотезу о том, что пункты - статистически независимы
для гипотетической шкалы на рис.2 и совместное принятие любых двух пунктов может быть приписано
Возрастание переменной-свойства случаю. Т.е. условная вероятность принятия пункта Im при принятии
Пункты и респонденты представлены соответственно столбцами пункта Im+1 равна просто вероятности принятия Im.
и строками шкалограммной матрицы. Пункты расположены от мак- Согласно шкальной гипотезе, для дихотомических пунктов наи-
симальной до минимальной степени выраженности свойства. Респон- большее возможное число наблюденных паттернов ответа будет на
денты расположены сверху вниз по убыванию рангового порядка единицу больше числа пунктов. Согласно гипотезе о независимости,
критерия. Знаки "+" соответствуют согласию респондента с пунк- максимальное число паттернов ответа для п дихотомических пунктов
том-суждением, знаки "—" - несогласию. Очевидно, что популяр- будет 2". В общем, следуя шкальной гипотезе, можно ожидать, что
ность пункта является обратной функцией его положения на знание числа пунктов, на которые данный респондент дал позитив-
шкале. Положение респондента на шкале зависит от частоты поло- ный ответ, позволит полностью предсказать паттерн его ответов. Это
жительных ответов для данного набора пунктов-суждений. На следствие шкальной гипотезы обозначается понятием "воспроизво-
практике приближение к идеальной шкалограмме, представлен- димость". Как уже говорилось, получение абсолютной гутмановской
ной таблицей 1.3, может быть достигнуто упорядочением пунктов шкалы на реальных данных маловероятно. Поэтому на практике
по их популярности (частоте положительной реакции) и упорядоче- балл присуждается посредством приписывания индивида к шкально-
нием респондентов по частоте позитивных реакций для шкал, му типу (входящему в паттерны ответов идеальной шкалы) таким
близких к абсолютной. Для шкал, близких к абсолютной, число образом, чтобы ошибка воспроизводимости была минимальной. Т.е.
положительных ответов может быть использовано как балл шкальный тип - это группа респондентов, дающая паттерны ответов,
респондента, так как обычно оно хорошо коррелирует с резуль- предсказываемые идеальной шкалой. Скажем, для опросника из
татами применения более сложных методов присуждения баллов четырех пунктов имеет место следующая ситуация: + + + +;
[21. С.272 ]. В общем же случае при неабсолютной шкале респондент - + + +; - - + +; - - - + ; - - - - . Нешкальный паттерн
получает балл того шкального типа, который ближе всего к его + - - - может быть отнесен к шкальному типу - - - - с одной
паттерну ответов. Различные вычислительные процедуры включают ошибкой (по шкальной гипотезе один позитивный ответ предпола-
перестановку строк и столбцов, комбинирование категорий отве- гает паттерн - - - + , однако при отнесении в этот шкальный тип
та и, иногда, "переворачивание" направления шкалы для некото- ошибок воспроизводимости было бы две). Общей мерой соответствия
рых пунктов-суждений. Целью здесь является максимальное при- шкальной модели данным служит коэффициент воспроизводимости
ближение к паттерну ответов, соответствующему шкальной ги- (ReP), равный:
потезе.
Сопоставление шкальной гипотезы и случайной гипотезы о неза- ReP = 1 — число ошибок воспроизводимости
висимости пунктов имеет следующее обоснование. Существование /общее число ответов

54 55
В качестве основного критерия для определения приемлемости максимальной дисперсии баллов. По мнению Б.Грина [21. С.276-
набора пунктов как шкалы Гутман предложил использовать величи- 277 ], метод максимальной дисперсии баллов не играет большой роли
ну коэффициента воспроизводимости не ниже 0.90. Т.е. ответы, в шкалограммном анализе, однако получаемые несколько ортого-
классифицированные как "ошибка", должны составить не более нальных систем баллов (главные компоненты) могут представлять
десяти процентов наблюдений. Однако этот критерий сам по себе интерес с формально-математической точки зрения. Гутман показал,
недостаточен, так как еще сам Гутман показал, что коэффициент что для абсолютной шкалы - если оценки различных систем баллов
воспроизводимости для небольшого набора пунктов, которые стати- появляются как функции первоначальных шкальных баллов - первая
стически независимы, может быть очень высоким [222. Р.277-311]. главная компонента является монотонной функцией шкальных бал-
Поэтому если пункты дихотомические, их должно быть не меньше лов и, таким образом, может быть использована как метрика
десяти. Кроме того, манипулируя матрицей ответов при конструи- системы.
ровании шкалы, исследователь в определенном смысле увеличивает Вторую главную компоненту, имеющую одну точку перегиба,
шансы шкальной гипотезы. Поэтому возникает необходимость в Гутман отождествлял с также {/-образной функцией интенсивности
дополнительных критериях: значительный разброс в маргиналах установки (см. с.29), хотя основания для этого отождествления не
пунктов, минимизация ошибки для каждой категории ответа, не вполне ясны.
слишком высокая частота нешкальных паттернов ответа. Учитывая Модель Гутмана равно применима к аффективно-, когнитивно- и
неоднозначность этих критериев, некоторые авторы предложили поведенческо-субъектным шкалам, единственное различие между
собственные алгоритмы "осторожного" конструирования шкалы. Так которыми будет заключаться в содержании вопросов.
Г.Апшоу предлагает следующую процедуру определения того, фор- В данном разделе, как уже говорилось, мы не стремились дать
мирует ли конкретная совокупность данных гутмановскую шкалу полный обзор существующих моделей шкалирования. Кроме того,
[237. Р.104-105]: наряду с реальной шкалограммой, где минимизи- детальный анализ классических моделей измерения установок содер-
рованы ошибки воспроизводимости и известна популярность каждого жится в ряде работ, в том числе упоминавшихся нами (см. так-
пункта, построить гипотетическую матрицу данных, основываясь на же: [111; 112; 117]). Однако нам необходимо остановиться на неко-
гипотезе независимости пунктов (для определения ответов гипоте- торых особенностях классического подхода к шкалированию устано-
тических респондентов предлагается пользоваться таблицей двузнач- вок и его позднейших модификаций, которые особенно существенны
ных случайных чисел). Далее по тем же правилам, что и для для понимания той критики, которой подвергся этот подход и его
реальных данных, осуществить необходимые перестановки в гипоте- "общепринятые истины" в результате появления причинных моде-
тической матрице, чтобы минимизировать ошибки воспроизводимо- лей измерения (и ошибки измерения), к рассмотрению которых мы
сти. После этого следует сравнить оценки гутмановских шкал для перейдем в последующих главах.
реальных и гипотетических данных. Для этого реальные и гипоте- Прежде всего, " классический" подход к шкалированию уделяет
тические респонденты разбиваются на категории в зависимости от лишь незначительное внимание содержательной разработке понятия
числа ошибок (респонденты с одной, двумя ошибками и т.д.). К ошибки измерения. Точнее, этот подход довольствуется статистиче-
получаемой таблице сопряженности можно применить тест хи-квад- скими понятиями ошибки и истинного значения, унаследованными
рат, чтобы проверить случайную гипотезу для совокупности реаль- от традиционной психометрии, т.е. от родительской дисциплины.
ных данных. Однако, строго говоря, эта процедура позволяет прове- Безусловно, сама психометрическая парадигма шкалирования не
рить лишь конкурирующую гипотезу о том, что между пунктами нет остается неизменной. В последние десятилетия большую популяр-
никакой систематической взаимосвязи, тогда как гутмановская ги- ность (но не практическое значение) приобрели стохастические и
потеза утверждает, что эта взаимосвязь почти абсолютна. Поэтому эксплораторные модели шкалирования. В стохастических моделях
строгое и однозначное решение этой процедурой не гарантируется. (одно- и многомерных) наличие ошибки измерения явно постули-
Фактически критерии подтверждения шкальной гипотезы, следу- рется в противовес детерминистским моделям. Кроме того, модель
ющей из модели Гутмана, это критерии функционального единства, шкалирования в этом случае обычно используется не как техника,
основанные на внутренней согласованности реальных данных. Как а как критерий оценки валидности, лежащей в ее основании модели
уже говорилось, эти критерии никак не связаны с правилами при- измерения [112. Р.32]. В последнем случае оценки параметров
писывания баллов. Чаще всего респонденты получают баллы, соот- модели, полу-ченные при вычислениях меры соответствия модели
ветствующие числу положительных ответов для "своего" шкального данным, могут быть использованы как числовые значения объектов
типа, что отражает их положение на ординальной шкале латентного на шкале, т.е. измерение оказывается дополнительным "подарком
свойства-переменной. Сходным образом пункты (точнее, границы валидной модели" [219. Р.8]. Под эксплораторными шкальными
между категориями ответа) получают баллы в зависимости от их моделями понимаются модели, полученные в результате применения
ранга в шкалограммной матрице. Сам Гутман предложил аналити- специальных процедур для выявления внутренней структуры дан-
ческую процедуру присвоения баллов, основанную на критерии ных. Строго говоря, эксплораторными (т.е. "исследующими", "раз-
56 57
ведочными") являются не модели, а эти процедуры анализа данных, трудность высказывания в этой модели совершенно аналогична по
позволяющие для данного набора показателей (индикаторов будущей смыслу трудности вопроса в общей теории тестов и восходит к
шкалы) выяснить, есть ли у него структура и может ли эта структура представлению о трудности теста в тестировании способностей.
быть представлена в виде одно- или многомерной шкалы. (Позднее Функция, показывающая вероятность положительной реакции на
мы еще вернемся к идеологии эксплораторного анализа данных и данное высказывание в зависимости от значения латентной установ-
поиска моделей измерения.) ки, называется графиком данного высказывания (либо характери-
Кроме того, для "ранних" процедур шкалирования была харак- стической кривой вопроса, как в общей теории тестов). Модель
терна еще одна особенность. Процедуры приписывания баллов субъ- налагает ограничения на графики высказываний-пунктов. В частно-
ектам или суждениям не были основаны на каких-то явных эмпири- сти, вероятность положительного ответа должна монотонно возра-
чески наблюдаемых отношениях доминантности/эквивалентности стать с ростом значения латентной установки, графики отдельных
между объектами оценивания. Следовательно, для таких шкал ока- пунктов (вопросов, высказываний) шкалы не должны пересекаться
зывались неприменимы постулаты репрезентационной теории изме- (трудность пункта должна определяться однозначно) и т.п. В случае,
рения, так как отношения числовых значений шкалы не соответст- когда ошибка измерения отсутствует или ею можно пренебречь,
вовали каким-то наблюдаемым отношениям в эмпирической системе. кумулятивная стохастическая модель одномерной шкалы превраща-
Т.е., приписывание числовых значений не отражало (не репрезен- ется в детерминистскую, т.е. в идеальную модель, предполагаемую
тировало) отношения между эмпирическими объектами. Как мы уже шкалограммным анализом по Гутману. Достоинством стохастиче-
говорили, обсуждая шкалы категориальных оценок (например, шка- ской модели 'Р.Моккена является возможность вывести из самой
лы Терстоуна и Ликерта), приписывание чисел здесь в значительной модели некоторые ограничения на данные, позволяющие проверить
мере произвольно. На этом основании построена часто применяемая модель. Т.е. решение о "шкалируемости" данной совокупности
классификация шкал, разделяющая их по типу измерения [117]. высказываний или вопросов здесь, в отличие от гутмановской моде-
Шкалы оценок основаны на индексном измерении, когда числовое ли, уже не основано на достаточно произвольных оценках процента
приписывание осуществляется более или менее произвольно. Шкаль- допустимых "ошибок", а приписывание балла индивиду не является
ные процедуры, в которых приписывание числовых значений объек- результатом грубой аппроксимации к "шкальному типу". (Пример
там соотнесено с эмпирически наблюдаемыми отношениями между построения и использования стохастической кумулятивной шкалы
объектами, называют репрезентсщионными. Однако даже стохасти- политических установок, наряду с подробным описанием шкальной
ческие эксплораторные модели шкалирования, разработанные в модели, можно найти в [219].) Однако и в этой стохастической
рамках психометрического подхода, отчасти основываются на тех же эксплораторной модели присутствуют те принимаемые без проверки
принимаемых произвольным решением (by fiat) предположениях, (хотя, возможно, в ряде случаев верные) предположения классиче-
что и ранние шкалы установок. Эти предположения не подвергаются ской психометрики. Это, во-первых, требование локальной не-
проверке сами по себе, как некоторые содержательные гипотезы о зависимости высказываний (пунктов) шкалы и, во-вторых, мо-
"механизмах" реального мира, порождающих социологические дан- дель латентной черты (установки, способности), являющейся причи-
ные. Они представляют собой своеобразную "обратную проекцию" ной ответов или реакций опрошенных. Локальная стохастиче-
в реальность ряда нерефлексируемых особенностей сложившегося на ская независимость предполагает, что позитивный ответ данного
более ранних этапах развития психометрики "образа человека". респондента на некий вопрос шкалы статистически независим от
Чтобы проиллюстрировать сказанное, мы вкратце остановимся лишь ответов, данных на другие вопросы. Обоснованность и даже необхо-
на одном характерном примере. Стохастическая одномерная модель димость этого ограничения очевидна, когда речь идет, скажем, о
шкалирования, разработанная Р.Моккеном [182 ], основана на отно- совокупности арифметических задач, предназначенных для измере-
шениях доминантности между объектами из различных множеств и ния одной и только одной способности. Однако, зная о различных
может использоваться для построения шкал установок (в последнем типах систематической ошибки измерения, характерной для лично-
случае два множества объектов - это субъекты и высказывания, как стных и установочных шкал (позиционная тактика ответов, арте-
и в случае с только что рассмотренной шкальной моделью Гутмана). факты "социальной желательности" и др., о чем будет подробнее
Модель позволяет получить ординальное упорядочение субъектов и говориться в главе II), реалистично ли предполагать, например, что
высказываний (пунктов) шкалы. Из нее также можно вывести ряд человек, согласившийся с утверждением о несущественности его
ограничений на возможные ответы и, соответственно, проверить личного участия в выборах, согласится с тем, что ему не следует
соответствие модели данным. В модели вводится понятие трудности голосовать, с той же вероятностью, что и другой человек, не согла-
высказывания (пункта), содержательная интерпретация которого сившийся с первым утверждением [219. Р.12]? .
предполагает существование некоторого порогового значения латент- Что же касается предположения о латентном континууме свойст-
ной установки, позволяющего респонденту положительно ответить ва-установки, являющейся причиной явных ответов-индикаторов, то
на шкальный вопрос или согласиться с высказыванием. Очевидно, оно восходит к идеям Ф.Гальтона и Ч.Спирмена и отражает попу-
58 59
лярные в начале века представления о едином конституциональном Глава вторая
факторе, определяющем многообразие поведенческих проявлений. В ПРОБЛЕМА КАЧЕСТВА ИЗМЕРЕНИЯ В СОЦИОЛОГИИ:
главе III, рассматривая различные модели измерения, мы убедимся, ОТ КОНСТРУКТА К ИНДИКАТОРУ И ОБРАТНО
что латентная черта (свойство, фактор) далеко не всегда являются
причиной своих индикаторов. Сейчас же отметим, что модель латен-
тной черты чрезвычайно удобна для исследования соотношений 1. Надежность, валидность и ошибка измерения:
генотипа и фенотипических проявлений организма в биологии или кризис классической теории тестов
при изучении некоторых специальных способностей, имеющих вы-
сокую степень наследственной обусловленности. Однако примени- Ключевые понятия оценки качества измерения - надежность и
мость модели одномерного континуума латентного свойства в шка- валидность - пришли в социологию из классической теории тестов и
лировании установок требует куда более веских обоснований, поми- психометрики одновременно с появлением первых шкал установок.
мо соображений удобства. В нашу задачу не входит исчерпывающий анализ концепций надеж-
ности и валидности в теории тестов 1, поэтому мы лишь кратко
рассмотрим некоторые базисные предпосылки, допущения и резуль-
таты "классического подхода". Это позволит нам понять причины,
определившие недостаточность этого подхода для оценки социологи-
ческого измерения и вызвавшие возникновение новых представлений
и методов оценки качества измерения в социальных науках.
Общее теоретическое определение надежности в психометрике
связано с понятием устойчивости процедуры относительно объектов
измерения [36. С.74-75 ]. В общем виде надежность относится к тому,
"в какой мере измерения повторяемы - для одних и тех же индивидов
при использовании различных мер одного и того же свойства или для
различных лиц при использовании одной меры свойства" [191.
Р. 172 ]. Если используемая мера, скажем, удовлетворенности браком,
надежна, то при использовании разных конкретных индикантов
(графических шкал, вербальных самоотчетов и т.д.) на одной и той
же группе исследователь будет получать идентичные результаты. И,
с другой стороны, повторные замеры будут давать тот же уровень
удовлетворенности браком. Надежность-устойчивость (ретестовая,
диахроническая надежность) характеризует точность измерения при
проведении повторных тестирований. Надежность-согласованность
(одномоментная надежность) связана с внутренней согласованно-
стью инструмента, т.е. теста или батареи тестов [36. С.68-69].
Соответственно ненадежная мера (инструмент измерения) при из-
мерении какого-то свойства у данной группы лиц будет давать
неповторяющиеся или несогласованные результаты. Надежность из-
мерительной процедуры, таким образом, находится в обратной связи
с количеством случайных ошибок в процессе измерения. Случайные
ошибки при повторном выполнении тестовых заданий могут быть и
результатом неконтролируемых изменений условий тестирования, и
следствием "моментальных" изменений в состоянии самого испыту-
емого. Итак, ретестовая надежность говорит о репрезентативности
результатов теста для различных случаев его применения [2. С. 104 ].
Применимость ретестовой надежности как оценки качества измере-
ния ограничена содержательными соображениями, теоретически-
61

1
Такой анализ в значительной мере осуществлен в отечественной литературе (например
[1:36]).
ми представлениями об исследуемом свойстве (отсутствие эффектов ставляют значительный интерес и сейчас (см., в частности: [199]).
"памяти", "научения", ограничение временными интервалами пред- И все же, оценивая роль критериально-ориентированного подхода в
полагаемой стабильности исследуемого свойства). Поэтому даже в валидизации данных, полученных в массовых опросах, следует
психологическом тестировании повторное тестирование применяется помнить об ограничениях, присущих этому подходу: объективный
прежде всего для оценки надежности элементарных психомоторных критерий, используемый как "эталон", нередко нуждается в столь
и сенсорных тестов [2. С.106]. Надежность-согласованность имеет же строгой оценке своих измерительных качеств. Здесь нам пред-
другую содержательную природу и оценивается обычно через кор- ставляется вполне справедливой точка зрения Дж.Конверс: "(Дейст-
релирование либо взаимозаменяемых форм теста, либо частей одного вительно) Проводящие опросы исследователи редко выходят за
теста. пределы самоотчетов. Исследования валидности не только дорогосто-
Валидностъ измерения в самом общем смысле характеризует ящи, но и чрезвычайно сложны. Существует возможность сравнивать
соответствие измерения его цели [131. Р.226; 191. Р.75]. Иначе "субъективные" самоотчеты с "объективными" данными официаль-
говоря, валидность процедуры (инструмента) измерения состоит в ных документов, но большая часть документов, к которым обраща-
однозначности и правильности получаемых результатов относитель- ются для валидизации обследований, также построена на самоотче-
но измеряемого свойства объектов, т.е. относительно предмета изме- тах и, следовательно, обычно уязвима для тех же самых ошибок
рения [36. С.74 ]. Надежность является необходимым, но не доста- измерения и смещений, что и сами обследования. В некоторых
точным условием валидности, что и зафиксировано в основном ситуациях информация, полученная в социологических опросах,
психометрическом соотношении: валидность теста не может превы- может оказаться лучше официальных данных: выборки часто точнее,
шать надежность. Уже на интуитивном уровне очевидно, что надеж- чем переписи, и современная машинная обработка данных может
ный инструмент может измерять нечто другое вместо подразумева- успешнее устранять ошибки, чем системы "бумага-и-карандаш", до
емого конструкта (например, не температуру, а давление, или не сих пор доминирующие в официальных записях" [109. Р.415].
интеллект, а особенности "познавательного стиля"). Классическая Интерес к качеству измерения стал ведущей ориентацией в том
теория тестов признает принципиальное различие надежности и "возрождении" проблематики измерения в социологии, которое про-
валидности, однако не дает средств для независимой оценки валид- изошло в середине шестидесятых годов, после приблизительно пят-
ности и, фактически, сводит ее лишь к критериальной оценке надцатилетнего периода снижения популярности работ в данной
(отсюда "надежность теста - это, собственно, его валидность по области [177. Р.1].
отношению к параллельному тесту" [172. Р.63]). Недостаточность классической теории тестов была осознана в
Нужно отметить, что самостоятельное осмысление проблем каче- социологии в конце 60-х - начале 70-х годов. Не отрицая полезности
ства измерения в социологии долго тормозилось сравнительно мень- традиционного подхода к оценке надежности и валидности эмпири-
шим к ним интересом. Собственно специально-методические иссле- ческих измерений, содержащих случайную ошибку, специалисты по
дования проблем валидности показателей вплоть до середины 60-х социологическому измерению (Дж.Борнстед, Х.Блейлок, Г.Костнер,
-70-х годов не были распространены в американской эмпирической Р.Зеллер, Р.Алтаузер и др.) показали принципиальную недостаточ-
социологии. Единственным исключением, достаточно серьезным по ность и ограниченность психометрического подхода к оценке каче-
масштабам и результатам, было так называемое Денверское иссле- ства социологического измерения.
дование валидности. Это исследование, проведенное денверским Для того чтобы убедиться в обоснованности этой оценки, рассмот-
филиалом Национального центра исследований общественного мне- рим некоторые основные положения психометрического подхода. Так
ния (NORC), было одним из трех основных проектов Комитета по как измеряемое (наблюденное) значение (X) из-за погрешности
измерению мнений, установок и потребительских нужд, созданного измерения (e) не равно истинному (Т) , то можно записать:
С.Стауффером в 1947 г. [104 ]. В исследовании, проведенном в 1949г.,
сопоставлялись данные ответов респондентов на фактографические X = Т + е. (2.1)
вопросы с данными официальной местной статистики (регистрация Далее обычно делаются некоторые предположения об ошибке
и голосование, взносы в местную казну, наличие водительских прав измерения [172. Р.36]:
и читательского билета библиотеки и т.п.). Сопоставляя данные 1) отрицательные и положительные величины ошибок
официальной статистики, принимаемые за истинное значение, с взаимопо-гашаются, т.е.
ответами респондентов, исследователи обнаружили, что данные са- E(e) =0
моотчетов часто существенно от них отклонялись. Величина расхож-
дений составляла от нескольких процентов до почти 50%, в зависи- 2) истинные баллы и ошибки не скоррелированы:
мости от содержания вопроса. Изучалось также влияние интервью- ρ (t,e)= 0;
ера. Данные этого исследования критериальной валидности пред-
62 6
3
3) корреляция между значением ошибок по одному измерению и  x2   t2   e2  2 te следует:
истинным значением по другому равна нулю:
 2   t2   e2
р (e1, t2) = 0;
Отсюда следует определение надежности как доли дисперсии
4) корреляция ошибок различных измерений равна нулю истинного компонента измерения от общей дисперсии теста:
Р (e1, е2) = 0. т.е. корреляция параллельных тестов (пунктов) равна дисперсии
истинного компонента, деленной на дисперсию измеренных значе-
Из этих предположений следует: ний. Формула (2.5) позволяет выразить дисперсию истинного балла
Е(Х) = Е(Т). через наблюдаемые величины:

Отсюда:  t2   x2 pxx ' (2.6)


 x2   2 (t  e) т.е. через произведение дисперсии измеренных значений и корреля-
ции параллельных форм. Подстановка этого выражения в формулу
Так как ковариация истинных баллов и ошибок (по определению) (2.4) дает:
равна нулю, т.е.
 t2  x pxx '
2
 te  0
p  2
2
xt  p xx ' (2.7)
то из формулы x  x2
 t2 дисперсий измеренных баллов; 3) равенство корреляций параллель-
Надежность = p xt 
2
ных форм с другими переменными; 4) равенство попарных интер-
 x2 корреляций нескольких параллельных форм. Из всей совокупности
Если вся дисперсия измеренных баллов связана с ошибкой изме- Предполагается, что параллельные формы имеют ряд важных
рения (по определению случайной), то надежность равна 0. Если бы свойств: 1) равенство средних измеряемых значений; 2) равенство
никакие ошибки не влияли на измерение, то надежность теста была Т.е. оценка надежности - это корреляция параллельных форм.
бы равна 1. В классической теории тестов валидность определяется как кор-
Так как из формулы (2.4) на практике нельзя произвести оценку реляция измерения X и измерения Y [172. Р.61 Г]2;
надежности (дисперсия истинных баллов неизвестна), то для оценки
надежности вводится представление о параллельных (собственно  xy
параллельных или тау-эквивалентных) формах теста. Для нас до- Валидность = p xy  (2.8)
статочно рассмотреть случай параллельных тестовых измерений, для  x y
которых вводится предположение о равенстве истинных компонентов
и дисперсий ошибочных компонентов, что можно выразить следую- Если X и Y - параллельны в вышеуказанном смысле, то:
щим образом: Х-Т Y=T =о .
X=T и X = T +e
В результате для валидности получают cледующую формулу:
где
 e2 =  e2
 xy  t2
и T=T  xy   (2.9)
64  x y  x2
Отсюда очевидно концептуальное тождество критериальной ва-
лидности и надежности 3. Однако, отмечают, Р.3еллер и Э.Карминес, "...
по определению

2
О других подходах к теоретико-эмпирической валидизации мы будем говорить
далее.
3
Но валидность теста по отношению к какому-то иному тесту не может превосходить
квадратного корня его надежности [172. Р.72].
65
классическая теория тестов применима тогда и только тогда, когда Конкретные причины, вызвавшие неудовлетворенность социоло-
ошибка измерения является полностью случайной. Попросту говоря, гов, занимавшихся проблемами измерения, механическим переносом
в классической теории тестов предполагается, что вся ошибка изме- традиционной психометрической "парадигмы" оценки качества из-
рения случайна" [242. Р. 11]. Конечно, в социологическом опросе мерения, очень отчетливо сформулированы в книге Р.Зеллера и
или даже в исследовании, использующем агрегированные данные Э.Карминеса [242. Р. 11-12]. Во-первых, предположение о случайной
переписи, существует много источников случайной, несистематиче- природе всей ошибки измерения, приемлемое в психологическом
ской ошибки измерения. Например, ошибки кодирования или про- эксперименте, чаще всего необоснованно, когда речь идет о выбороч-
стого подсчета могут носить случайный характер. Если респондент с ном обследовании, опросе и т.п. Измерение, основанное на таком
равной вероятностью (при повторном опросе) выбирает одну из типе данных, обычно включает и случайный, и неслучайный
соседних категорий ответа, ошибка измерения также может носить ошибочный компонент. Характерными примерами являются эффек-
несистематический характер. Однако как только эта ошибка теряет ты "памяти", социальной желательности, установки на позитивный
случайный характер, "это уже не проблема надежности, а скорее или негативный ответы. В более широком смысле здесь можно
проблема валидности" [225. Р.13]. Как только ошибка измерения говорить о неэквивалентности экспериментального и статистического
становится неслучайной, часть вариации в индикаторах оказывается контроля (применительно к обоснованности научного вывода в не-
связанной с каким-то иным конструктом, отличным от того, который экспериментальных исследованиях эта проблема была впервые сфор-
исследователь стремится измерить. Т.е. систематический компонент мулирована в [212], см. также: [168]). Еще более существенным
дисперсии надежного индикатора может относиться только к теоре- является то обстоятельство, что систематическая ошибка измерения
тически специфицированному конструкту, что обеспечит валидность имеет место и тогда, когда "совокупность индикантов измеряет не
индикатора. Невалидная же, но надежная мера, может полностью только подразумеваемый теоретический концепт или даже репре-
или частично относиться к другой переменной, а не к той, для зентирует совершенно иной концепт" [242. Р.11]. По определе-
измерения которой она была сконструирована. Следует отметить, нию такого рода ошибки не обладают, по крайней мере, некоторыми
что введенное в психометрике в 50-х годах понятие конструктной из статистических свойств, приписываемых собственно случайной
валидности (см., например: [18]) также было сфокусировано на ошибке измерения. Т.е. имеет место как минимум одно из следую-
отношениях эмпирических показателей к теоретическим конструк- щих обстоятельств:
там, однако процедуры оценки конструктной валидности не могли E (e)  0,  te  0,  e1t2   e1e2  0
быть разработаны в рамках традиционного подхода. Для оценки
конструктной валидности предлагалось использовать экспертные Р.Зеллер и Э.Карминес приводят пример утвердительной и отри-
оценки, содержательные соображения, внешние критерии4.0днако цательной тактик ответа со стороны респондента. В этом случае
систематическая разработка представлений о конструктной (или сформулированные в одном "направлении" пункты, даже если они
концептуальной) валидности и процедур ее оценки стала возможна никак не связаны сами по себе, оказываются скоррелированными. И
лишь в результате возникновения в американской социологии моде- уже нельзя говорить о равенстве нулю корреляции между ошибками
лирующего подхода к измерению и широкой трактовки измерения измерения по отдельным пунктам-индикантам.
как "теоретически-нагруженного" процесса, связывающего концеп- Вторым недостатком классической теории тестов является, с
ты теории с эмпирическими индикаторами (вторая половина 60-х точки зрения этих авторов, отсутствие адекватной концептуализа-
-70-е годы). Анализу этих новых подходов к измерению, причинных ции валидности и отношений между валидностью и надежностью,
моделей и "вспомогательных теорий измерения" посвящена третья т.е. то, о чем уже говорилось выше. Вслед за Дж.Борнстедом,
глава этой книги. Здесь же нам важно зафиксировать, что инновации Р.Зеллер и Э.Карминес утверждают, что простое знание того, что
в концептуализации надежности и валидности, как и появление валидность измерения (как корреляция с другой переменной) не
новых методов оценивания качества социологического измерения, может быть выше квадратного корня его надежности, не решает
были вызваны, прежде всего, той трактовкой измерения, которая никаких проблем. Это соотношение, как отметил Дж.Борнстед [95.
первоначально была предложена в работах Х.Блейлока 5 . Р.97 ], не дает никакого прямого знания о валидности как о степени
соответствия индикаторов предполагаемой цели измерения. Более
4
Близки к идее конструктной валидности и процедуры конвергентно- того, сама оценка валидности оказывается "побочным продуктом"
дискриминантной валидации [106]. О роли последних для возникновения оценки надежности [242. Р. 12].
моделей с множественными индикаторами, а также присущих им ограничениях Осознание двух названных принципиальных ограничений, при-
будет сказано позднее (в послед-нем параграфе этой главы). сущих психометрическому подходу к оценке качества измерения в
5
Самой существенной в данном контексте чертой предложенного Х.Блейлоком
подхода явился отказ от узкого понимания измерения как" присваивания социологии (игнорирования систематической ошибки и неудовлетво-
численных значений объектам или событиям в соответствии с правилами", рительной теоретической дифференциации надежности и валидно-
предложенного С.Стивенсон в 40-х годах, и переход к пониманию измерения как сти), привело к возникновению новых идей и ориентации. В после-
процесса связывания абстрактных понятий теории с наблюдаемыми
эмпирическими индикаторами.
66 67
дующих двух разделах мы проанализируем два близких подхода к которая относится к истинному компоненту" [242. Р.13]. Т.е.:
валидности и надежности измерения, очень характерных, на наш Такое определение согласуется с данными выше
взгляд, для происходивших в 60-е - 70-е годы изменений.
2. Надежность и валидность эмпирическх моделей  t2   s2  2 ts  x2   r2
Надежность  
Первый из этих подходов полнее всего изложен в уже  x2  x2
упоминавшейся книге Р.Зеллера и Э.Карминеса [242 ].  2
Р.Зеллер и Э.Карминес предложили переформулировку Валидность  t2
определений валидности и надежности, а также критерии и x
практические методы их оценки. Предложенная ими содержательными определениями валидности и надежности.
концептуализация надежности и валидности (как и другие Кроме того, из него становится ясным, что различие валидности и
ориентации в моделирующем подходе к измерению) базируется надежности индикатора зависит от присутствия систематической
на том, что наблюдаемые значения измеряемой переменной (X) ошибки измерения. Если совокупность индикаторов измеряет
равны сумме истинных значений (Г), систематической ошибки только заданный теоретический конструкт с точностью до
измерения (S) и случайной ошибки измерения (R)6. Т.е.: случайных погрешностей, то валидность будет равна надежности.
X = Т + S + R. (2.10) Чем больше доля систематического ошибочного компонента, тем
Тогда для генерального среднего измеренных баллов можно больше надежность будет превосходить валидность.
Наконец, в гипотетическом случае, когда вся наблюденная дис-
записать: персия индикатора будет обусловлена систематической ошибкой
Е(Х) = Е(T) +E(S), (2.11) (скажем, из-за неправильной спецификации теоретической моде-
так как для случайной ошибки действительны прежние ли), валидность будет нулевой, а надежность - абсолютной.
предположения. Для конечной выборки наблюдений среднее Все изложенные представления, как уже говорилось, в
измеренное значение переменной становится несмещенной принципе были достаточно осознаны и в психометрической
оценкой "истинного балла", к которой прибавлена средняя традиции (по крайней мере, к середине 60-х годов). Однако
систематической ошибки [242. Р.12]. близкая к контролируемому эксперименту ситуация
В присутствии и случайной, и систематической ошибок для тестирования позволяла, в принципе, находить " паллиативные"
средства конструктной валидации.
ожидаемой дисперсии можно из: Скажем, необходимость учета содержательных представлений о
тестируемом свойстве в области образовательного тестирования
σ2x = σ2( t + s + r ) могла реализовываться в конкретных процедурах оценки
вывести, что репрезентативности тестового материала (по объему и содержанию)
относительно заранее известной учебной программы. Идею
σ2x = σ2 t + σ2 s + σ2 r + 2σ ts (2.12) совпадения теоретической модели "поведения" изучаемого
свойства с реальностью легко было осуществить, например, через
(Так как по определению σ tr = σ sr = 0.) Здесь существенно, оценку его возрастной динамики в "естественном эксперименте"
что так как Т и S могут быть скоррелированы, суммирование (если тест X измеряет вербальный интеллект, то показатели для
дисперсий Т, S и R не обязательно дает дисперсию X. Причем детей должны расти с каждым годом) [2. С.141 ].
ковариация Т и S может быть и больше, и меньше нуля. Можно В социальных же науках, где экспериментальный контроль
оценить дисперсию случайной ошибки и наблюдаемых практически недостижим, где целью является не тестирование или
значений. Однако невозможно ничего сказать о дисперсии дифференциальная диагностика, а измерение переменных на
истинного компонента, систематической ошибки и ковариации микро-и макро-уровне, и где систематическая ошибка весьма
TS, не сделав каких-то дополнительных содержательных типична, неудовлетворенность таким подходом к качеству
предположений ("не существует чисто механической измерения была значительно острей. Это и вызвало появление
процедуры для идентификации латентных переменных с гаран- новых подходов в данной области.
тированной теоретической валидностью" [146. Р.9]). Если принять предложенную формулировку надежности и
В этом контексте можно ввести следующие различения для валидности, то можно выделить два обобщенных критерия их
надежности и валидности: "Надежность - это доля неслучайной оценки: 1) внутренняя ассоциация как паттерн взаимоотношений
дисперсии; валидность - та доля дисперсии наблюденных значений, между
6
Хотя это и не является предметом нашего обсуждения, укажем, что сходный в не- 69
которых чертах анализ погрешностей измерения был проделан в отечественной литера-
туре [23].
68
индикантами, предназначенными для измерения одного сводных показателей (суммирующих оценки для отдельных ин-
теоретического конструкта, и 2) внешняя ассоциация как паттерн дикаторов-субтестов) - "альфа" Кронбаха - равна надежности лишь
отношений между индикантами данного конструкта и другими когда все индикаторы (пункты) строго параллельны или тау-эквива-
переменными [242. Р.151 лентны 19, т.е. она устанавливает нижнюю границу надежности
Критерий внутренней ассоциации предполагает, что [242. Р.59] (см. также: [1. С.123; 36. С.70]).
существуют позитивные интеркорреляции между индикаторами, что С практической точки зрения, условия, когда "альфа" Кронбаха
соответствует содержательному пониманию надежности как согла- не дает хорошей оценки надежности, весьма существенны для
сованности. Наиболее популярной техникой оценки внутренней социологического измерения. Это происходит, когда "пункты изме-
согласованности пунктов (совокупности индикаторов, субтестов ряют один концепт в неравной мере, или измеряют более одного
шкалы) является факторный анализ. Сторонники факторного ана- концепта, равно или неравно" [242. Р.60]. Существенна здесь и
лиза как средства оценки качества измерения иногда склонны типичная для социологии ситуация невозможности подобрать боль-
полагать, что именно факторный анализ, выявляющий эмпириче- шое число индикаторов-пунктов для одного теоретического концеп-
скую многомерную структуру матрицы корреляций между пункта- та20. Уже сами условия, ограничивающие полезность коэффициента
ми, может использоваться для полной оценки конструктной валид- Кронбаха, предполагают применимость и релевантность оценки
ности отдельных индикаторов:"Каждый тест может быть охаракте- надежности, основанной на факторном анализе. В этом контексте
ризован посредством основных факторов, определяющих его показа- становится понятной популярность двух коэффициентов надежно-
тели, весом, или нагрузкой, каждого фактора и корреляцией теста сти, основанных на факторном анализе - "тега" и "омега". Общее
с каждым из них. Такая корреляция именуется факторной обоснование использования факторного анализа в оценке надежно-
валидностью теста" [2. С.143]. Однако такая точка зрения переоце- сти достаточно полно и лаконично изложено в отечественной работе
нивает роль факторного анализа в оценке качества измерения, хотя [1. С.127-129], где, в частности, отмечается, что так как для
бы в силу того, что не принимает во внимание проблему заданного числа пунктов в тесте (шкале) большей корреляции между
интерпретации факторов. Сама по себе интерпретация фактора как пунктами соответствует большая надежность, а высокая корреляция
релевантного определенному теоретическому конструкту (или, нао- также является условием выделения небольшого числа значимых
борот, представляющего другой конструкт либо артефакт метода) факторов, то надежность теста может быть связана с результатами
невозможна без принятия каких-то предположений о валидности его факторизации. "Факторизация гомогенного теста должна давать
измерения (за исключением случая, когда систематическая ошибка один главный фактор, на котором эти (входящие в тест) высказыва-
отсутствует). ния имели бы заметные нагрузки... Использование факторного ана-
Нам кажется более обоснованным использование факторного лиза для определения надежности гетерогенного теста сводится, по
анализа как средства оценки систематических компонентов наблю- существу, к процессу гомогенизации посредством факторного рас-
денной дисперсии, т.е. "доли наблюденной дисперсии, представлен- членения высказываний теста. При этом каждый выделенный фактор
ной истинными значениями и неслучайными или систематическими объединяет в себе предложения одного гомогенного теста" [1. С.127-
ошибками" [242. Р.15]. Исходя из этого, Р.Зеллер и Э.Карминес 128].
предложили процедуру использования факторного анализа для эм- Коэффициент "тега" основан на модели анализа главных компо-
пирической оценки надежности, создания новых факторных пере- нент и может быть содержательно интерпретирован с учетом того,
менных (шкал) и построения исходной модели измерения, адекват- что основная задача в ней заключается не в объяснении корреляции
ность и параметры которой подлежат дальнейшей комплексной между признаками, а в объяснении максимальной доли дисперсии
оценке. наблюдений [52. С. 15]. Надежность гомогенного теста (шкалы),
Наиболее эффективным подходом, с точки зрения этих авторов, образованного пунктами, вошедшими в первую компоненту:
является одновременная оценка надежности и валидности измерения.
При этом для оценки надежности (и как воспроизводимости, и как
согласованности) часто применимы методы классической теории те- N 1
стов, сравнительные достоинства которых авторы анализируют в [242.  (1  )
Р.48-76 ]. Оценка надежности связана со случайной ошибкой измере- N 1 1
ния (чем выше надежность, тем ниже случайная ошибка и наоборот). где N - число пунктов, a A i - наибольшее (т.е. первое) собственное
Точные оценки надежности измерения могут быть получены при ис- число. (В случае гетерогенного теста можно подвергнуть повторному
пользовании моделей факторного анализа. Причина заключается в анализу каждую полученную подсовокупность пунктов-высказы-
том, что наиболее общий метод оценки надежности для линейных 71
70
19
Т.е. имеют идентичные истинные значения, либо попарно отличающиеся на
аддитивную константу.
20
В психологическом тестировании, особенно образовательном, обычно возможно
составить достаточно длинный тест из гомогенных субтестов.
ваний.) "Тета" может рассматриваться как максимизированное зна- [242, Р. 159 ]. Оценка же систематической ошибки (и, таким образом,
чение альфа-коэффициента. валидности) в значительно большей степени является теоретической
Р.Зеллер и Э.Карминес рассматривают и другой коэффициент проблемой, чем сугубо статистической. Здесь не может существовать
надежности - "омега", основанный на модели общих факторов и чисто механической процедуры. Стратегия, предложенная Р.Зелле-
предложенный Д.Хейсом и Дж.Борнстедом в 1970 г. Приведем его ром и Э.Карминесом, основана на теоретических импликациях
упрощенную формулу для корреляций между пунктами: процедур эмпирического измерения. Исходя из теоретической кон-
цепции, делаются предсказания о возможных отношениях валиди-
a   hi2 зируемых показателей к другим (внешним) переменным. Т.е. пред-
  1 полагается, что валидная мера имеет такой паттерн связей с теоре-
a  2b тически релевантными внешними переменными, который согласован
с ожидаемым на основании теоретических предположений. При этом
где а - число пунктов, Ь - сумма корреляций между пунктами, hi уверенность исследователя в валидности эмпирического измерения
-общность P-ro пункта. тем выше, чем больше таких проверок конструктной валидности,
При этом отмечается, что так как общности в модели общих основанных на критерии внешней ассоциации, удалось успешно
факторов оцениваются, существует доля неопределенности при вы- провести. Наиболее эффектной является стратегия одновременного
числении "омеги" (но не "теты"). Все три коэффициента ("альфа", оценивания надежности и валидности, так как эмпирические пока-
"омега" и "тега") будут равны, если корреляции между пунктами затели должны обладать и статистическими свойствами надежности,
равны (при равенстве дисперсий пунктов). Для тау-эквивалентных и концептуальной валидностью при измерении сложных и высоко-
пунктов а < в < Q [242. Р.63]. Различия между коэффициентами абстрактных понятий социологической теории.
"альфа" и "тега" либо "омега" будут существенны, когда высказы- Так как предложенный Р.Зеллером и Э.Карминесом подход в
вания теста (шкалы) имеют очень гетерогенные интеркорреляции значительной мере зависит от конкретного теоретического контекста
(однако эти различия можно уменьшить, исключив "слабые" пунк- и причинной модели измерения, т.е. от содержательных соображе-
ты). Процедура, предложенная Р.Зеллером и Э.Карминесом для ний, его эффективность проще всего продемонстрировать на каком-
оценки надежности [242. Р.67-75 ], включает в себя факторизацию, то примере. Таким примером может служить, в частности, прове-
построение и эмпирическую оценку параметров причинной модели денный ими анализ предложенной У.Шутцем концепции межлично-
измерения, коррекцию на аттенюацию корреляций между неизме- стного поведения и соответствующей модели измерения. Эта концеп-
ряемыми конструктами в модели (если в исследовании ставилась ция "Фундаментальной ориентации межличностных отношений в
задача оценить взаимосвязь различных конструктов, измерявшихся поведении" (FIRO-B) постулирует, что лишь удовлетворительные
разными совокупностями индикаторов) , оценку надежности сводных отношения с другими людьми могут удовлетворить потребности,
показателей, анализ матрицы корреляций после резидуализации мотивирующие поведение в сфере общения [46; 209 ]. Безуспешность
(чтобы убедиться, что она содержит только случайную ошибку). попыток установить такие отношения ведет к фрустрации потребно-
Обсуждаются также критерии, указывающие на присутствие только сти и, следовательно, к возрастанию тревожности. Существует три
случайной ошибки [242. Р.71-75]. После выполнения всех шагов фундаментальных межличностных потребности - включенность,
этой процедуры исследователь имеет основания утверждать, что контроль и расположение (любовь). Кроме того, поведение, относя-
"причинная модель содержит всю надежную дисперсию" [242. Р.76 ]. щееся к каждой из межличностных потребностей, описывается
Однако абсолютная надежность, как уже говорилось, не гаранти- в двух ортогональных измерениях: поведение самого субъекта по
рует валидности эмпирических показателей. В принципе, очень отношению к другим и желаемое им поведение со стороны
надежная мера может быть совершенно невалидной, если все инди- других. В соответствии с этими теоретическими представлениями
канты отражают лишь систематическую ошибку. Источником этой был создан опросник, состоящий из шести шкал, измеряющих
систематической ошибки может быть и артефакт метода (самый ортогональные, независимые (по гипотезе Шутца) теоретические
простой и распространенный случай - позиционный стиль ответа, концепты: 1) выражаемая субъектом межличностная потребность во
response set), и другой теоретический конструкт, неучтенный в включенности, 2) "желаемая" потребность во включенности (т.е.
модели. На многочисленных примерах Р.Зеллер и Э.Карминес пока- связанная с ожидаемым поведением других людей, 3) выражаемая в
зывают, что задача оценки валидности значительно сложнее, чем в поведении субъекта потребность в контроле, 4) желаемый контроль
случае оценки надежности (именно в силу возможного присутствия со стороны других людей, 5) выражаемая потребность в проявлении
систематической ошибки). Конечно, если в процессе измерения расположения, 6) желаемое расположение со стороны других.
имеют место лишь случайные ошибки, валидность будет равна Опросник FIRO-B состоит из 54 пунктов, т.е. из 9 высказываний
надежности, однако "при измерении большинства теоретических для каждой из 6 шкал концептуального пространства межличност-
концептов, используемых в социальных науках, измерение, по всей ного поведения размерности 3x2.
вероятности, содержит и случайную, и систематическую ошибку"
73
72
Р.Зеллер и Э.Карминес провели факторный анализ опросника в
целом и каждой из шести шкал, проверку конструктной валидности Рис. 3. Модель измерения Контроль
по критерию внешней ассоциации, а также оценку надежности для шкалы кош-роля
опросника FIRO-B.21
суммарных баллов по каждой шкале после исключения "слабых"
пунктов [242. Р.123-136, 155-158 ]. Одновременная оценка надежно-
сти и валидности показала, что высказывания FIRO-B измеряют в
действительности четыре теоретически специфицированных концепта:
включенность, контроль и два аспекта расположения - "Близкое и
личностное" и "Холодное и дистантное". Проведенный анализ не
дает оснований для предложенного Шутцем разведения желаемого и
ожидаемого поведения в сфере межличностных отношений. При
этом, в частности, выяснилось, что полученное при исходной фак-
торизации расщепление "контрольных" пунктов на два фактора
отражает не наличие двух измерений контроля, а существование
общего фактора контроля и артефакта метода - позиционного стиля с
гветов у части испытуемых. Т.е. формулировка исходных вопросов
вела к систематической ошибке измерения для части выборки.
Применение критерия внешней ассоциации и Q-техники факториза-
ции (объединение респондентов в группы-факторы) позволило отде-
лить влияние "позиционных" ответов от истинного влияния фактора
контроля. Для иллюстрации этого результата приведем оцененную
модель измерения для шкалы контроля опросника FIRO-B (рис.3). Позиционный ответ
(ResPonse set )
Однако, как отмечает Р.Зеллер и Э.Карминес, артефакты метода не
всегда могут быть обнаружены. В случае шкалы контроля из оп- возможно лишь при соотнесении понятия "валидность" со "вспомо-
росника FIRO-B, выявление не связанной с содержанием шкалы доли гательной теорией измерения", о чем будет идти речь в главе III дан-
систематической вариации ответов, зависящей от формы представле- ной работы. Однако в этом подходе достаточно ясно выражено
ния высказываний, было облегчено тем, что часть пунктов была не- стремление перейти от понимания измерения как "числового
гативной (по отношению к измеряемому свойству). Если же влияние приписывания" к его трактовке как процесса связывания понятий
артефактов метода на все индикаторы имеет одно направление, то теории с языком наблюдения и, следовательно, к комплексной оценке
задача оценки модели измерения становится практически невыпол- качества измерения с учетом и статистических свойств, и со -
нимой без привлечения дополнительных теоретических соображений держательной адекватности. Безусловную ценность представляют и
для повторной конструктной валидации и дополнительных показате- содержащиеся в этом подходе эвристические приемы, позволяющие
лей для расширения модели измерения. Традиционный подход, осно- установить зависимость качества эмпирических индикаторов от вли-
ванный прежде всего на чисто статистической оценке надежности, яния неслучайных ошибок измерения - артефактов метода и ошибок
здесь неэффективен. В этом примере он привел бы к получению "за- теоретической спецификации, искажающих параметры модели из-
вышенной" надежности при низкой валидности. Конечно, некоторые мерения. Однако прежде чем давать оценку новым, самостоятельным
приемы выявления артефактов метода, разработанные в психометри- подходам к измерению, оказавшим существенное влияние на
ке, могут быть применены в социологическом измерении - например, американскую эмпирическую социологию 60-х - 70-х годов,
использование "прямых" и "обратных" пунктов. Однако в большин- рассмотрим в общих чертах еще один такой подход, использующий
стве случаев эти простые средства неэффективны и едва ли приме- иную стратегию оценки качества показателей.
нимы. Едва ли возможно разрабатывать "шкалы лжи" для каждого
социологического опроса или вводить в анкету многочисленные воп-
росы - дубли или "экзотические" вопросы для выявления случайной 3. Множественные индикаторы
тактики ответов респондента. в оценке качества измерения
Конкретный подход к оценке качества измерения, предложенный Подход, основанный на использовании множественных индика-
Р.Зеллером и Э.Карминесом, не стал окончательным решением торов и путевого анализа, был предложен в статье Герберта Кост-
черченных проблем. В этом подходе недостаточно разработаны нера, вышедшей в 1969 г. [113]. Однако сама идея использования
проблемы измерения, возникающие при неправильной спецификации
теоретической модели. Удовлетворительное решение этих проблем 75
74 21
Отношения между " контролем" и артефактом измерения для 15 высказываний шкалы
контроля. Коэффициенты соответствуют факторным нагрузкам после вращения.
Источник- [242. Р. 134].
многих показателей для оценки надежности и валидности струмент (анкету, план интервью) редко удается включить доста-
социологического измерения была достаточно популярна уже в точно большой список высказываний, связанных с единственным
первой половине 60-х годов. Сам Г.Костнер в указанной статье свойством22. Однако исследователю все же необходима какая-то
подчеркивает, что первую общую формулировку многоиндика- процедура для оценки качества измерения и внесения поправок на
торного подхода можно найти в работах Х.Блейлока (1964) [81], ошибку измерения в статистические оценки корреляций между
Р.Кёртиса и Э.Джексона (1962) [116], а также в книге Ю.Уэбба и изучаемыми свойствами23.
соавт., посвященной нереактивному измерению в общественных В условиях, когда имеется лишь один индикатор для каждой из
науках [238 ]. На наш взгляд, еще более прямой является связь исследуемых переменных и отсутствует возможность повторных
многоиндикаторного подхода и процедуры конвергентной-дискри- замеров, нельзя оценить надежность этого индикатора (которая, в
минантной валидизации с использованием многометодной матрицы терминах путевого анализа, равна квадрату эпистемической корре-
свойств (черт), или "ДО-М"- матрицы. Эта процедура была ляции, т.е. корреляции измеряемого свойства и индикатора). При-
предложена Д.Кэмпбеллом и Д.Фиске в статье 1959 г. [106] и чинная модель измерения становится непроверяемой, если не принять
рассматривается в психометрической литературе как эффективный нереалистическое предположение об абсолютной надежности
подход к комбинированной оценке конструктной валидности. Ис- индикатора (эпистемические корреляции равны 1) или пренебрежимо
пользование причинных моделей со множественными индикаторами малой ошибке измерения [113. Р.245]. Ситуация меняется уже с
позволило определить границы обоснованности такой оценки, о чем введением двух индикаторов для каждой переменной. На рисунке 4
пойдет речь далее, однако до изложения основных идей многоинди- X и Y- это исследовательские переменные, о связи между которыми
каторного подхода целесообразно просто зафиксировать наличие говорит теоретическая гипотеза, с - структурный коэффициент,
представляющий связь между X и Y в совокупности. Далее х1 и х2 -это
такой связи. индикаторы теоретической переменной X, которая сама по себе
Многоиндикаторный подход позволяет одновременно проводить неизмеряема, так как является теоретическим конструктом 24. Соот-
оценку конструктной валидности индикаторов, эмпирическую ветственно, у1 и у2 - индикаторы Y, a a, b, d и е - это так называемые
проверку принятой исследователем причинной модели измерения эпистемические корреляции, связывающие индикатор с соответству-
и надежности индикаторов для сравнительно простых моделей ющей неизмеряемой переменной. Принимается, что все переменные
измерения. Прежде всего, рассмотрим проблему оценки надеж- стандартизованы и, соответственно, а, b, с, d и е - это путевые
ности, так как именно она позволяет понять тесную связь данного коэффициенты, т.е. стандартизованные значения структурных коэф-
подхода со спецификой планирования исследования и сбора фициентов (см.: [53. С. 177]). Правила путевого анализа позволяют
данных в социологии. В принципе, обычные методы оценки надеж- выразить наблюдаемые значения корреляций (в нашем случае,
ности (как внутренней согласованности и как повторяемости), при- r x1x2 , r x1у1 , r x1у2 , r x2у1 , r x2y2 , r y1y2 ) 25 через последовательность
нятые в теории тестов, вполне эффективны, когда речь идет о коэффициентов причинной диаграммы (о путевом анализе см.,
сравнительно стабильных свойствах, состоящих из многих высказы- например, [53]).
ваний тестах и сравнительной легкости доступа к источникам На рис.4 изображены также возмущения или ошибки еi для ко-
данных. торых принимаются допущения о случайном характере (они не скор-
В социологии же (и других общественных науках) единицей релированы друг с другом и их генеральное среднее равно нулю), и,
анализа часто является не индивидуум, а какой-то макроуров- кроме того, члены-концептуальные ошибки - ui , представляющие все
невый социальный объект - определенного типа группа, регион, неизвестные причины концептуальных переменных (X и У) в много-
культура и т.п. Возможности повторного тестирования в неболь- индикаторных моделях. Для последних принимается, что они случай-
шом временном интервале, как и возможности использования многих ны по отношению друг к другу, к возмущениям в индикаторах
индикаторов ("пунктов"), нацеленных на измерение одного и того
же свойства, обычно крайне ограничены. С одной стороны, при 77
использовании агрегированных данных официальной статистики
социолог заранее ограничен существованием больших интервалов 22
Причины здесь могут заключаться и в обычно присущем социологическому исследованию
между переписями, так как за такой срок может меняться сам
многоцелевом характере, и, вероятно, в некотором различии мотивов к сотрудничеству у
уровень интересующего его свойства (в [225. Р.29] приводится опрашиваемого в ситуациях социологического опроса и тестирования.
пример медианного уровня дохода как показателя экономических 23
Уже в работе 1968 г. П.Зигель и Р.Ходж использовали причинные модели для изучения
ресурсов штата). В результате, нельзя использовать оценку рете- влияния ошибки измерения на корреляцию между переменными [179].
стовой надежности. С другой стороны, чаще всего попросту невоз- 24
Подробнее об этом будет говориться в главе Ш.
можно подобрать более двух-трех индикаторов интересующего ис- 25
Для упрощения изложения, как это нередко делается в литературе, мы не будем пока
следователя свойства. И даже когда это возможно (преимущест- подчеркивать различие между выборочными оценками и параметрами совокупности,
венно, при изучении установок), в реальный социологический ин- т.е. будем рассматривать выборочную корреляцию г как эквивалент параметра сово
76 купности/)^ . *"
Корреляции r xiyj могут быть получены из данных для всех
индикаторов, т.е. это известные величины. В системе из шести
уравнений содержатся и пять неизвестных (путевых ко-
эффициентов). Следовательно, мы можем получить оценку любого из
пяти коэффициентов: и корреляции истинных значений с, и
эпистемические корреляции a,b,d и е, квадрат которых равен
надежности индикатора. Однако модель, изображенная на рис.4,
переопределена (шесть уравнений, пять неизвестных). Идея,
предложенная Г.Костнером, как раз и заключалась в том, чтобы
использовать избыточную информацию для оценки согласованности
(несогласованности) получаемых значений коэффициентов и,
соответственно, проверки обоснованности предположений, включенных
в модель, в частности, предположения об отсутствии определенного рода
неслучайной ошибки измерения. Для рассматриваемой нами модели на
рис.4 из уравнений 2.15 и 2.18 мы получаем:

rx1 y1 ry2 x2  abc 2 de

( ei) и по отношению к другим, точно указанным причинам


Аналогично, из уравнений 2.16 и 2.17 получаем:
каждой концептуальной переменной26. rx1 y2 ry1 x2  abc 2 de
Итак, используя правила путевого анализа, можно записать
следующие уравнения, выражающие корреляции между Следовательно,
индикаторами на рис. 4, через путевые коэффициенты: rx1 y1 ry2 x2  rx1 y 2 ry1 x2 (2.20)
rx1x2  ab Г.Костнер обозначил уравнение 2.20 как критерий
согласованности. Если данные действительно порождены
rx1 y1  acd причинной моделью, изображенной на рис.4, то критерий
(2.14) согласованности должен соблюдаться для наблюдаемых
(2.15) корреляций как необходимое условие. Однако, если модель
78 ошибочна, то критерий не соблюдается, так как присутствует
неслучайная ошибка измерения (Г.Костнер обозначил
исследовавшиеся им типы ошибок как "дифференциальное сме-
щение" или "дифференциальную постоянную ошибку", так как
она будет постоянна для повторных измерений одного случая,
но варьировать для разных случаев, будучи скоррелированной с
другим индикатором в модели [113. Р.248]). Эта неслучайная
26
ошибка будет присутствовать, если хотя бы один индикатор
В нашем обсуждении возмущения, в силу принятых предположений, не будут детерминируется
играть большой роли.
79
rx1 y1 ry 2 x 2  rx1 y 2 ry1 x 2

внешней переменной помимо концептуальной переменной, Г.Костнер также показал, что уже для моделей, содержащих
которую он представляет, и собственной случайной ошибки три индикатора каждой переменной, можно выявить некоторые
измерения. Г.Костнер, как уже говорилось, показал, что типы систематических ошибок, т.е. не просто обнаружить
критерий согласованности для модели с двумя индикаторами наличие систематической ошибки, но и "локализовать" не-
каждой переменной является необходимым, но не валидный индикатор и исключить его. Для откорректированной
достаточным условием, и рассмотрел случаи, когда уравнение модели измерения, где ошибки измерения случайны, из соответст-
2.20 выполняется (в пределах ошибки выборки) при наличии вующих путевых коэффициентов можно получить оценки надеж-
неслучайной ошибки измерения. Один из таких случаев ности. Для модели с тремя индикаторами для каждой из двух
показан на рис.5А, другой - на рис.5Б. переменных существует девять критериев согласованности (Костнер
Диаграмма на рис.5А отражает ситуацию неслучайной рассматривал ее как совокупность девяти двухиндикаторных моде-
ошибки при измерении индикаторов одной переменной лей) [113; 225. Р.38-39]:
(например,y1 и у2 - смежные вопросы анкеты, измеряющие
одно качество). В случае такой модели изменится лишь
уравнение 2.19 из системы, которое не использовалось
при получении критерия 2.20. На рис.5Б изображена
ситуация, когда один индикатор детерминируется двумя
неизмеряемыми переменными, что вполне возможно, когда
между переменными существует тесная взаимосвязь и они
трудно разделимы теоретически (например, это социальный
и экономический престиж соответственно). Для этой модели
в нашей первоначальной системе уравнений 2.14 -2.19 нужно
переписать два:

Приведем пример. Пусть в действительности имеет место


Однако и в этом случае критерий согласованности будет ситуация, изображенная на рисунке 6. Исследователь же
выполняться, т.е. исходит из предположения, что присутствуют лишь случайные
так как : (а с d + аf) (Ь с е) = (асe) (b с d + bf) . ошибки измерения, т.е. у индикаторов х 3 и у, нет общего
источника вариации.
Кроме того, в некоторых случаях (например, при наличии Так как для каждой переменной используются три индика-
неслучайной ошибки измерения между индикаторами разных тора, то, рассматривая, какие из критериев 2.20-2.28 не выполняют-
концептуальных переменных) различия между левой и правой ся, можно обнаружить источник неслучайной ошибки в модели. В
частями критерия согласованности будут очень малы и данном случае не будут удовлетворены условия 2.21, 2.22, 2.27
неотличимы от ошибки выборки, так как будут выражены и 2.28, включающие корреляцию r x3y1 , тогда как в
через произведение многих путевых коэффициентов, каждый остальных случаях равенство будет удовлетворено. Таким
из которых меньше единицы. образом, исследователь может исключить из модели два
Как показал Х.Блейлок [83] , предложенный Г.Костнером невалидных индикатора (х 3 и у 1 ) и далее получить
подход, может быть распространен на все рекурсивные модели множественные оценки остальных параметров, в частности,
(определение рекурсивных причинных систем см.: [53. С.139-141] оценить надежность остальных индикаторов, как в случае модели
) , т.е. для любого числа концептуальных переменных. Так, для с двумя индикаторами.
двухиндикаторной модели с тремя переменными будут Следует, однако, помнить о том, что при увеличении числа
существовать три критерия согласованности. Однако индикаторов в модели число получаемых оценок будет возрастать в
добавление новых переменных будет вести к резкому
возрастанию вычислительных сложностей и числа оценок для
каждого коэффициента, что порождает проблемы оценивания.
Поэтому для сложных моделей со многими переменными и
многими индикаторами, которые, однако, не очень типичны для
обычной практики, используют факторно-аналитические 6 И.Ф.Девятко 81
процедуры, основанные на методе максимального
правдоподобия.
80
82

Рис. 7.
Причинная
модель
измерения
для двух
свойств и
двух
методов.

геометрической прогрессии [242. Р. 173]. Поэтому обычно


модели с тремя индикаторами используют для выявления
невалидных индикаторов (систематической ошибки измерения),
а для оценки параметров возвращаются к модели с двумя
индикаторами, не порождающей серьезных проблем, если число
концептуальных переменных невелико [225. Р.40].
В начале данного раздела речь шла об определенном
сходстве многоиндикаторного подхода с процедурой
конвергентно-дискрими-нантной валидизации, предложенной
Д.Кэмпбеллом и Д.Фиске. При этом мы оговорили, что
построение причинных моделей измерения со
множественными индикаторами позволило показать, что
использование многометодной матрицы свойств далеко не
всегда является эффективным средством проверки конструктной rx1 x2  ab  lpR
валидности. Так как процедура Д.Кэмпбелла и Д.Фиске
неоднократно описана в литературе (например, [2. С. 144-146]), ry1 y2  cd  mkR
укажем лишь, что суть процедуры заключается в применении
разных методов измерения - заполняемый респондентом
опросник, структурированное интервью, наблюдение и т.п. - к
оценке двух или более свойств. В результате получается
матрица "свойства/методы", элементами которой являются
коэффициенты корреляции, включающие в себя и коэффици-
енты надежности (на главной диагонали), и коэффициенты
валидности. В работах Р.Алтаузера и соавт. [72; 73] содержится
анализ "М-М"-матриц с помощью причинных моделей
измерения. Проиллюстрируем выводы, полученные в этих
работах, на простейшем примере двух свойств (концептуальных
переменных X и Y) и двух методов. Матрица для этого примера
показана в таблице 2.1.
Не считая оценок надежности (заключенных в скобки), в
матрице содержится шесть наблюдаемых коэффициентов
корреляции для
Таблица 2.1. Матрица корреляций для двух свойств и двух методов [225. Здесь X и Y - значения двух свойств, М{ и М2 представляют влияние
Р.48] двух используемых методов. Существует какая-то корреляция меж-
ду истинными значениями двух свойств (S), и между влияниями
двух методов. Последнее предположение весьма правдоподобно
если допустить существование сходных факторов, воздействующих
rx1 y1  acS  lm
rx1 x2  rx1 y1  0
на реакцию респондента - социальной желательности, тематики
самопрезентации или просто сходства способа измерения. Модель на
рис.7 не доопределена (шесть измеряемых коэффициентов и десять
Рис. 6. Модель Костнера с
параметров, подлежащих оцениванию).
двумя переменными и шес- Однако, следуя правилам путевого анализа, можно выразить все
тью индикаторами (с выяв- корреляции через путевые коэффициенты, что позволяет оценить
ляемой неслучайной ошиб- четыре основанных на этих корреляциях критерия валидности,
кой). предложенных Кэмпбеллом и Фиске (что и было сделано в работах
[72; 73], см. также: [225. Р.47-55]).
Таким образом, получаем для коэффициентов валидности (одно
свойство, разные методы):
(2.29) (2.30)
Для корреляций между различными свойствами, измеренными
разными методами:
(2.31) (2.32)

четырех различных индикаторов (два метода для каждого из 83Для корреляций разных свойств, измеренных одним методом:
двух свойств). Вариация каждого индикатора имеет два
независимых источника - свойство, т.е. концептуальная Третий критерий предполагает, что корреляция двух измерений
переменная, и метод измерения. Представим эти отношения с (разными методами) одной переменной будет выше, чем корреляция
помощью причинной модели измерения на рисунке 7. двух черт, измеренных одним методом. Например,

rx1 y2  adS  lkR


rx2 y1  bcS  pmR
т.е.
rx2 y2  bdS  pk
(а b + I P R) — (а с S + I т)
(2.33) (2.34)
или
Первый критерий Кэмпбелла и Фиске требует, чтобы ко-
эффициенты валидности г и ry1y2 были высоки и статистически (а b — а с S) + I (P R — т) > 0.
значимы. Однако из уравнений 2.29 и 2.30 очевидно, что это По аналогии с предыдущим критерием, если предположить, что
требование будет выполняться либо из-за высоких значений эпистемические корреляции b и с приблизительно равны, первый
эпистемических корреляций а, b, с, d, либо из-за того, что компонент будет функцией от (1 — 5) и его величина будет зависеть
влияние метода измерения велико (/, т, p и k) и методы скор- от корреляции между X и Y. Во втором компоненте присутствует
релированы (ср. обсуждение в предыдущем разделе). Следовательно, разность между произведением двух путевых коэффициентов - р и
R - и одним коэффициентом т. Так как величины путевых коэффи-
даже прямая оценка валидности будет корректной лишь если пред- циентов меньше единицы, то второй компонент, вероятно, будет
положить, что методы совершенно не скоррелированы. Но такое меньше 0. Если эффекты метода сильны, то значение второго
предположение может выглядеть правдоподобным лишь в очень компонента будет сравнительно большим и отрицательным, а инте-
редких ситуациях. ресующее нас различие между корреляциями - маленьким. Т.е., .если
Второй критерий предполагает сравнение между ко- дисперсия метода больше дисперсии свойства, то критерий будет не
эффициентами валидности и корреляциями между разными свойст- удовлетворен, что согласуется с идеей Д.Кэмпбелла и Д.Фиске.
Однако, чтобы дисперсия, связанная с методами, была заметна, связь
ry1 y 2  rx 2 y1  0 между свойствами (S) должна быть невелика или первый компонент
должен иметь сравнительно небольшое значение. Если же свойства
вами, измеренными разными же методами (стоящими в той же высоко коррелируют, то величина первого компонента будет неболь-
колонке и столбце). Корреляции между методами при измерении шой и результирующая разность корреляций r x1x2 и r x1y1
одного свойства должны быть выше, чем при измерении разных окажется маленькой даже тогда, когда второй компонент будет
свойств, т.е., например: также невелик. Т.е. в этом случае влияние артефактов метода будет
переоцениваться. Таким образом, третий критерий адекватен лишь
Для рассматриваемого коэффициента валидности это равнознач- для случая, когда заранее можно предположить отсутствие
но: значительной корреляции между свойствами.
cd + mkR-(bcS + PmR)>0. Четвертый критерий, предложенный Д.Кэмпбеллом и Д.Фиске,
предполагает сравнение паттернов корреляций внутри блоков, отно-
Перегруппируем слагаемые, чтобы разделить компоненты, свя- сящихся к одному методу (внутри пунктирных прямоугольников,
занные с концептуальной переменной и с методом: подобных выделенному в таблице 2.1) . Отношения между свойствами
(с d - b с S) + (k -P) т R > 0 . (2.35) должны сохраняться вне зависимости от используемого метода. Для
того, чтобы проверить этот критерий, "М-М"-матрица должна быть
Обсуждаемый критерий предполагает, что большое различие расширена хотя бы до трех свойств. Мы не будем приводить здесь
этих корреляций должно указывать на то, что два измерения выкладки, так как ход рассуждений аналогичен вышеизложенным.
У должны быть связаны сильнее, чем измерение Y и измерение Можно показать, что критерий будет удовлетворен даже при наличии
второго свойства. Действительно, если d и b приблизительно равны, существенных эффектов метода, если соответствующие пути будут
величина первого компонента будет функцией от (1 - S). Но для приблизительно равны бсак это было показано при анализе второго
этого нужно предположить, что второй компонент должен быть критерия валидности) 27 . В таком случае применение
близок к нулю. Это возможно либо когда влияния метода невелики четвертого
(либо корреляция между двумя методами равна нулю), либо
эфекты метода велики и приблизительно равны (k = P). В последнем
случае критерий будет удовлетворен при наличии сильных 85
артефактов метода.
Следовательно, осмысленное применение критерия дискрими-
нантной валидности возможно лишь при принятии допущения об
отсутствии сильных эффектов метода (что, как уже говорилось,
далеко не всегда может быть оправдано).
84

27
См., например: [225. Р.51-53].
сильные допущения (в частности, о постоянстве эпистемических
критерия ограничено ситуациями, коща можно заранее принять корреляций, т.е. фактически коэффициентов одномоментной надеж-
предположение о том, что каждый метод имеет отличное по величине ности) . Д.Уайли и Дж.Уайли показали, что это допущение не всегда
влияние для каждого свойства, т.е. выраженность артефактов дан- обосновано и предложили способ оценки модели с тремя волнами и
ного метода зависит от того, какое свойство измеряется. Это пред- одним индикатором без стандартизации.Единственным априорным
положение нельзя назвать очевидным, так как оно само нуждается предположением в этом случае является постоянство дисперсии
в проверке. ошибок индикатора [240 ]. Еще одно спорное допущение, присутст-
Таким образом, анализ критериев конвергентно-дискриминант- вующее в панельных моделях, - это нескоррелированность возмуще-
ной валидности с позиций причинных моделей измерения с множе- ний концептуальной переменной (концептуальных ошибок и. ) в
ственными индикаторами показал, что по крайней мере три из последовательные моменты времени. Как и в случае скоррелирован-
предложенных критериев в действительности требуют очень сильных ных ошибок измерения, прибавление дополнительных волн не дает
допущений, которые достаточно нечасто могут быть приняты даже возможности оценить параметры. Однако Д.Хейс показал, что при-
для простых ситуаций. Введение же даже небольших усложнений в бавление четвертой волны позволяет проверить гипотезу о нескор-
модель, приближающее ее к реальности (например, предположения релированности возмущений, так как в этом случае может быть
о воздействии измерения первого индикатора каждой черты на выведен критерий согласованности.
последующие измерения других индикаторов [225. Р.53-54 ]), делает Х.Блейлок предложил альтернативный подход для панельных
применение кэмпбелловского подхода к валидности практически моделей с использованием множественных индикаторов в двух или
невозможным. Работы Р.Алтаузера, Т.Хеберлейна и Р.Скотта, осу- более временных точках [85 ]. Получающиеся в результате модели
ществивших анализ возможностей и ограничений использования аналогичны ранее обсуждавшимся моделям с двумя переменными и
"М-М"-матриц для оценки валидности измерения, содержали и множественными индикаторами (только здесь вместо двух концеп-
некоторые подходы к выявлению влияния метода измерения для туальных переменных имеется одна, измеренная дважды). Преиму-
простейших моделей с двумя свойствами и двумя методами. Более щества использования множественных индикаторов в данном
общим, однако, представляется подход, связанный с увеличением случае - это достаточность двух волн данных, отсутствие ограниче-
числа свойств или числа используемых индикаторов. Переопределен- ний на устойчивость коэффициентов одномоментной надежности,
ными будут уже модели с четырьмя методами измерения для двух возможность проверки допущений о скоррелированности ошибок
свойств (либо модели, содержащие четыре измеряемых свойства и индикаторов с помощью уже описанных критериев согласованности.
два метода измерения). В этом случае появляется возможность Однако и здесь возникает проблема множественных оценок парамет-
оценки всех релевантных параметров. Однако, как уже говорилось, ров, о которой мы неоднократно упоминали и на которой вкратце
этот подход ведет к появлению множественных оценок каждого остановимся немного ниже после обсуждения проблемы значимости
параметра. выводов, получаемых при проверке модели.
Очень плодотворным оказалось применение многоиндикаторных Как было показано ранее, переопределенные модели со множест-
моделей измерения и для двух других классов задач - анализа венными индикаторами, дающие несколько оценок для каждого
сравнимости индикаторов [89] и оценки ретестовой надежности и параметра, позволяют сформулировать критерии согласованности.
истинной стабильности измеряемого свойства. Как отмечалось в Критерий согласованности - это средство проверки валидности для
предыдущем разделе, оценка ретестовой надежности в рамках тра- каждого из индикаторов и для модели в целом. И при изложении
диционного психометрического подхода осложнена проблемой ста- комбинированного подхода к оценке качества измерения в предыду-
бильности измеряемого свойства и применима к достаточно узкому щем разделе, и при анализе многоиндикаторного подхода мы неод-
диапазону ситуаций. Без явного задания модели измерения и при нократно подчеркивали, что наиболее адекватной стратегией оценки
наличии лишь двух замеров она может основываться лишь на валидности является построение и проверка модели измерения, а не
непроверяемом предположении об отсутствии истинных изменений валидизация отдельного индикатора. Однако любой критерий согла-
в концептуальной переменной. Априорное принятие такого допуще- сованности в моделях со множественными индикаторами предпола-
ния может считаться оправданным применительно к конституцио- гает, что при корректности модели левая и правая части критерия
нально обусловленным психофизиологическим характеристикам ин- должны быть равны. Если же их разность больше нуля, то возникает
дивида (например, скорости моторной реакции), но совершенно проблема оценки значимости этого различия. Обсуждая критерии
неприемлемо, когда речь идет о динамических социальных процес- согласованности и соответствующие модели, мы не уделяли внима-
сах. Даже при очень небольших временных интервалах мнения и ния этой проблеме, т.е. не подчеркивали, что любое нарушение
установки могут достаточно радикально меняться. равенства может быть связано и с выборочной природой данных. В
Д.Хейс (1971 г.) показал, что существует возможность получения действительности существует необходимость проверки гипотезы о
отдельных оценок надежности и стабильности при введении в панель вероятности выполнения равенства в совокупности при данной ве-
третьей волны [145]. Однако и здесь все еще требуются некоторые
87
86
личине отклонения от точного равенства в выборке. Следовательно, Далее с помощью стандартной таблицы t -распределения определяют
необходимо решить статистическую задачу проверки значимости. уровень значимости (для N - 1 степеней свободы).
Такой тест значимости был создан за несколько десятилетий до Существует, однако, еще одна проблема, возникающая при ис-
появления первых моделей со множественными индикаторами пользовании критерия согласованности. Если наблюдаемые корреля-
Ч.Спирменом и К.Хользингером (1924 г.) при разработке простой ции очень малы, то даже ошибочная модель может пройти проверку
модели факторного анализа [225. Р.70-72]. Предложенная этими значимости, так как разность между двумя парами таких корреляций
авторами величина "тетрадической разности" сходна с критерием заведомо будет очень мала. Поэтому обычно предлагается не исполь-
согласованности Костнера, поэтому оценка стандартной ошибки этой зовать критерий согласованности, когда корреляции между индика-
величины вполне подходит для аналогичной оценки различия между торами меньше или равны 0,3 [73; 225 ]. Для проверки корректности
левой и правой частями критерия согласованности. модели в этом случае рекомендуется сравнить между собой различ-
Тетрадическая (или тетрадная) разность (t d) для модели с двумя ные оценки каждого параметра. В случае, если эти оценки очень
переменными и четырьмя индикаторами определяется как: близки по величине, можно считать модель верной. Существуют и
td  rx1 y1 rx 2 y 2  rx1 y 2 rx 2 y1 другие, более сложные тесты значимости для моделей со множест-
венными индикаторами (см.: [176]).
Значительно более сложной проблемой является наличие несколь-
Для оценки стандартной ошибки (S.E.) используется формула ких различающихся оценок для каждого параметра. Это "цена", ко-
[225. Р.71]: торую приходится платить за переопределенность (которая, в свою
очередь, необходима для проверки согласованности). Как уже гово-
S .E.  (k1  2k 2  4k 3 ) / N  k 4 / N 2 (2.38) рилось, в модели с двумя переменными и четырьмя индикаторами для
где: каждого параметра имеется две оценки, в модели с тремя индикато-
рами для каждой переменной оценок будет уже девять и т.д. Даже
N - размер выборки если модель успешно прошла проверку по критерию согласованности,
k1  rx21 y2  rx22 y1  rx22 y2 эти оценки могут заметно расходиться. Возникает проблема выбора
между этими оценками эпистемических корреляций (т.е. надежности
k 2  rx1x2 rx1 y1 ry1 y2  rx1x2 rx1 y2 rx2 y2  rx1 y1 rx1 y2 ry1 y2  ry1x2 ry2 x2 ry1 y2 индикаторов) или корреляций между переменными с поправкой на
надежность. Для решения этой проблемы предлагались разные спо-
k 3  rx1x2 rx1 y1 rx2 y2 ry1 y2 собы: простое усреднение оценок для каждого параметра, усреднение
оценочных уравнений для получения одного значения и т.д. [225.
k 4  (1  rx21 y1 ) 2 (1  rx22 y2 ) 2  (1  rx22 y1 ) 2 (1  rx21 y2 ) 2 Р.73 ]. В принципе любая из этих процедур дает несмещенную оценку,
Так как данная формула предполагает довольно громоздкие так как правильно определенная модель является теоретически не-
смещенной. Однако в статистическом оценивании, помимо несмещен-
вычисления, то на практике используют ее значительно более ности, требуется и эффективность оценки, т.е. выборочное распреде-
простое приближение: ление оценок должно обладать сравнительно небольшой дисперсией.
(2.39) Так как обсуждение собственно статистических проблем несколько
выходит за рамки нашего изложения, ограничимся лишь двумя за-
S .E.  2r (1  r ) / N
мечаниями. Во-первых, отсутствие окончательного решения пробле-
мы "наилучшей" оценки служило поводом для критики многоинди-
- где г - среднее четырех корреляций, входящих в критерий. каторного подхода [242. Р.173 ]. Во-вторых, так как в переопределен-
Эта более простая формула может использоваться во всех случа- ной модели эффективной оценкой может быть лишь взвешенная сред-
ях, кроме тех, когда и N, и эмпирические корреляции малы. няя, где "веса" отражают вариативность исходных оценок, простое
Используя эту формулу для оценки стандартной ошибки, можно усреднение дает лишь несмещенную оценку. Конечно, для элемен-
применить простой ^-критерий для оценки значимости отличия тарных моделей с небольшим количеством оценок каждого параметра
полученной величины td от нуля [225. Р.71 ]. Значение будет равно эта проблема не очень существенна, любое взвешивание дает резуль-
отношению: тат, не слишком отличающийся от простого усреднения. Однако по
мере усложнения модели измерения (и увеличения числа оценок) воз-
t = td никает необходимость перехода от простых методов путевого анализа
к методам максимального правдоподобия.
S.E. Отметим, однако, что любые более сложные подходы к оценке
параметров могут применяться лишь к конкретной теоретически
88 8
9
специфицированной модели измерения с несколькими индикатора- структуры модели, заставляет
ми. Описанный нами подход со множественными индикаторами, как исследователя эксплицировать, явно
и подход к оценке качества измерения, обсуждавшийся в предыду- задавать все имеющиеся у него
щем разделе, важен именно для понимания содержательных аспек- представления о природе и взаимосвязи
тов измерения и роли модели измерения в комплексной оценке переменных, возможных влияниях метода
надежности и валидности. Понимание этой содержательной стороны
проблемы позволяет оценить вклад социологов в традиционные измерения на его результат. Тем самым
психометрические представления о надежности и валидности. возникают определенные гарантии
Оценивая роль рассмотренных подходов к реконцептуализации против опаснейшей иллюзии
понятия качества измерения в социологии, отметим, во-первых, что эмпирической социологии - иллюзии
возникновение этих подходов было бы невозможным без принципи- "самоочевидной интерпретируемости
ально новой и возникшей собственно в социологии трактовки изме- результатов измерения" (см.: [7; 35]), не
рения как основанного на содержательных теоретических представ-
лениях процесса соотнесения высокоабстрактных понятий теории с зависящей от теоретических
данными наблюдений, в " снятой" форме представленного в модели представлений. С другой стороны,
измерения. Во-вторых, сами новые подходы к оценке качества преодолевается противоположный соблазн
измерения, ориентированные на проверку гипотез об адекватности строить в принципе непроверяемые
принятой модели измерения (а не на оценку качества отдельных теории, где все связано со всем, в надежде,
показателей), послужили толчком к дальнейшему углублению именно что хороший методист должен найти
тех представлений об измерении, которые первоначально иници- способ устранить ошибки измерения и
ировали их появление28. Т.е. понимание сложной и носящей обоюд-
ный характер взаимосвязи теоретически заданного предмета изме- откорректировать инструмент (оценить
рения, его метода и конкретных эмпирических показателей, к ретестовую надежность отдельного
которому подводила рассмотренная концепция качества измерения, индикатора, указать корреляцию с
способствовало отказу от узко инструментальной трактовки функций суммарным баллом и т.п.). Конечно, тема
измерения. Новое, более широкое определение функций измерения зависимости измерения от теории не
очень точно, на наш взгляд, передано в следующем тезисе: "Их исчерпывается проблемами определения
(измерительных операций) неизменная функция коренится во вза - валидности и надежности (ряд других
имосвязях между их концептуальными и операциональными аспек-
тами, в семантически целесообразном и эмпирически реализуемом проблем будет анализироваться в
соответствии числовым операциям и в надлежащей спецификации, следующей главе), однако анализируя
которая соотнесена с природой объекта измерения, с используемыми эволюцию взглядов на качество
измерительными инструментами, применяемым способом измере- измерения в американской социологии
ния..." [9. С.31 ]. 60-х - 70-х годов, нельзя не признать, что
Рассмотренные подходы к оценке валидности и надежности изме- этот процесс характеризовался растущим
рения в силу своей относительной простоты не могут быть исполь- пониманием специфики целей, задач и
зованы в ситуациях, когда модель измерения очень сложна. Для
оценки параметров очень сложных моделей в последнее время методов собственно социологического
используются значительно более изощренные статистические проце- исследования, все большей
дуры (например, анализ ковариационных структур). Однако приме- "автономизацией" подходов и отказом от
нение таких процедур осмысленно лишь тогда, когда исследователь некритического копирования отдельных
имеет серьезные основания подозревать наличие конкретных типов приемов психометрики. не исключавшим,
неслучайной ошибки в своих данных и способен отчетливо сформу- впрочем, принятия конструктивных идей.
лировать проверяемую модель. В то же время достоинства сравни-
тельно простых подходов тесно связаны с их недостатками, т.е. с
существованием ограничений на сложность модели. Прежде всего,
необходимость заранее сформулировать все допущения, касающиеся
90

28
О том, как развивались эти общие методологические представления о природе измерения
и о его связи с социологической теорией, будет идти речь в последующих главах
Глава третья постоянным центром кристаллизации этого круга идей служит тема
"вспомогательной теории измерения", позволяющая удерживать оп-
КОНЦЕПТУАЛИЗАЦИЯ, ИЗМЕРЕНИЕ, МОДЕЛИРОВАНИЕ: ределенную теоретическую высоту даже в дебрях технических про-
НОВАЯ ТРАКТОВКА блем, скажем, константности параметров структурных уравнений
ДИАГНОСТИЧЕСКОЙ ПРОЦЕДУРЫ В СОЦИОЛОГИИ (при обосновании сравнимости измерений) или нелинейной связи
неизмеряемой переменной и переменной индикатора. Поэтому нам
1. Концептуализация и косвенное измерение представляется полезным, прежде чем перейти к обсуждению более
как предмет "вспомогательных теорий измерения" поздних взглядов Х.Блейлока, вкратце изложить идеи, развиваемые
(исходные предпосылки) в вышеупомянутой статье 1968 г.
Отмечая существование разрыва между социологической теорией
Впервые понятие "вспомогательной теории измерения" было и реальными эмпирическими исследованиями, Блейлок подчеркива-
введено Х.М.Блейлоком в статье 1968 г.29 В этой статье, названной ет, что если этот разрыв и нельзя полностью закрыть в силу
"Проблема измерения: разрыв между языками теории и исследова- ограниченности самого научного метода, то и попытки его игнори-
ния" [82], Блейлоку удается принципиально реорганизовать сам ровать всякий раз обнаруживаются в "эмпирических" на первый
"гештальт" традиционных споров о соотношении теоретического и взгляд проблемах - результаты исследований оказываются несопо-
эмпирического в социологическом анализе. В сущности, ни одно из ставимыми, в планировании исследования внимательный критик
используемых в статье понятий (теоретический конструкт, эмпири- находит огрехи (например, не были проконтролированы смешиваю-
ческий операциональный индикатор, измерение как приписывание щие факторы или взяты "не те" индикаторы), а выводы всегда можно
числовых значений объектам "по правилам", валидность) не несет в оспорить, так как для проверки всех возможных альтернативных
себе принципиально нового содержания. Новизна заключается в гипотез всегда не достает нужных данных. С точки зрения Блейлока,
том, что Блейлок определяет в качестве действительно проблематич- неоценимую роль в прояснении проблематичности соотношения
ного. Этим "действительно проблематичным" и теоретически нагру- теоретического и эмпирического, и прежде всего - отношения про-
женным пунктом оказывается сам процесс измерения, обычно рас- цесса измерения к процессу конструирования теории, сыграла поле-
сматривавшийся как скорее рутинная и собственно техническая мика вокруг операционализма, которая в социологии достигла мак-
манипуляция, обосновываемая если не на сугубо эмпирическом симума в 30-40-е годы. Операционализм и крайний эмпиризм свер-
уровне, то с помощью какой-то "общей теории измерения", не шили благое дело уже тем, что они "постоянно подчеркивали, что
имеющей ничего общего с содержательной (substantive) теорией, проблема измерения является ключевой для прогресса любой науки"
подвергаемой эмпирической проверке. В результате такой смысловой [82. Р.6]. Ведь даже самая красноречивая теория без адекватного
реорганизации принципиальной методологической проблемой в со- измерения обречена остаться непроверяемой, так как всегда сущест-
циологии оказывается для Х.Блейлока не "охватывающий" закон и вуют не менее красноречивые альтернативные теории.
не "аксиоматико-дедуктивная система" (хотя влияние этого круга Проанализировав взгляды П.У.Бриджмена, А.С.Эддиштона и за-
позитивистских идеалов ощущалось в ранних работах Блейлока и щищавшего операционалистский подход в социологии Дж.ЭЛанд-
справедливо критиковалось - см.: [183; 241]), а связь между содер- берга, Блейлок отмечает, что общей и не лишенной смысла посылкой
жательной социологической теорией и открытой по отношению к здесь является утверждение, что понятия эмпирически могут быть
этой содержательной теории концепцией измерения, чаще всего соотнесены не в терминах "внутренне присущих качеств" (напри-
остающейся имплицитной и "замаскированной" какими-то утили- мер, масса как количество материи), а в терминах действительных
тарными или ad hoc обоснованиями выбора эмпирических показате- эмпирических операций (показаний стрелки весов).
лей тех или иных теоретических переменных. В дальнейшем Блей- Это утверждение, с точки зрения Блейлока, обосновано постоль-
локу удалось более систематически проанализировать связи между ку, поскольку обнажает и подчеркивает принципиальное различие
концептуализацией и измерением и его более поздние работы содер- языков теории и эмпирического исследования. Блейлок особо отме-
жат детальный анализ возможностей учета в причинных теориях чает, что Бриджмен, в ответ на критику, признал что операции
измерения мультикаузальности, неразделимости содержательных и являются необходимым, но не достаточным условием введения по-
"измерительных" эффектов, принципиальной ограниченности до- нятий (т.е. смысл понятия может быть шире его операционального
ступных нам данных и возможностей сравнения и, более того, смысла), и более того - расширил круг возможных операций, чтобы
попытки определить круг "эмпирически безнадежных" ситуаций, включить в их число и нефизические. Наиболее существенными
когда теоретические споры и уточняющие эмпирические исследова- Блейлок считает следующие антиоперационалистские аргументы:
ния заведомо бесплодны [84; 86; 88; 90]. Исходной точкой роста, операциональные определения недоступны для конструктивной кри-
92 тики; препятствуют прогрессу науки, так как не позволяют работать
с новыми ситуациями и еще не измеряемыми понятиями (ср. [65 ]),
93
29
Некоторые основные положения концепции Блейлока были обоснованы в более ранних
работах [80; 81].
а кроме того, в силу своей финальности и ригидности препятствуют цвете электрона30. Рассматривается здесь и проблема изоморфного
дальнейшим попыткам усовершенствовать измерение и классифика- "отражения" понятий теории в понятия наблюдения, при этом
цию. И самое существенное, с точки зрения Блейлока, - неясным Блейлок вслед за Нортропом делает вывод о невозможности их
остается, как приходят к операциональным понятиям. Именно этот однозначного соединения и неизбежности существования
вопрос, будь он поставлен в операционализме, сделал бы возможным "остатка" - теоретически определенных понятий, не имеющих
анализ проблем концептуализации и измерения и, вероятно, избавил операционального индикатора. Самым же существенным в
бы операционалистский подход от крайних упрощений и некоторой обсуждении нортропов-ской концепции эпистемических
карикатурности. Но, с другой стороны, сама по себе артикулирован- корреляций для дальнейших рассуждений Блейлока оказывается
ная постановка этого вопроса во многом стала возможна именно в следующее - 1) не существует строго логического обоснования
результате бурных дискуссий вокруг операционализма. перехода от постулируемых понятий к интуитивным; 2)
Блейлок считает, что прежде чем практически решать проблему эпистемические корреляции непосредственно не наблюдаемы и
соотнесения высокоабстрактных понятий социологической теории с принимаются учеными "по общему согласию" как априорно (до
набором переменных, имеющихся в распоряжении социолога-эмпи- наблюдения и эксперимента) устанавливаемая взаимосвязь между
рика, ее нужно корректно сформулировать на некотором метауровне, постулируемыми сущностями и непосредственно наблюдаемыми
т.е. на уровне философии науки (отметим здесь, что для более фактами; и, как следствие предыдущих рассуждений, 3) никакая
поздних взглядов Блейлока вообще не характерно стремление обос- дедуктивно сформулированная теория не является "прямо
новать свой анализ дилеммы концептуализации и измерения отсыл- проверяемой" [82. Р.10-11 ]. И хотя в дальнейшем первая и вторая
ками к общим логико-философским или историческим концепциям из перечисленных констатации превращаются для Блейлока
науки, позитивистским или каким-нибудь иным, за исключением собственно в проблему, а для устранения или, по крайней мере,
предметного обсуждения или критики отдельных аргументов). В осознания всех логических следствий этой проблемы будут
качестве возможной конструктивной альтернативы операционалист- разрабатываться причинные модели измерения, эти рассуждения
скому подходу Х.Блейлок рассматривает подход, изложенный оказываются очень важны для становления концепции
Ф.Нортропом в работе 1947 г. [190]. Нортроп различает два типа теоретического обоснования измерения в социологии. Они
понятий (и два языка науки) - 1) понятия, задаваемые интуитивно, помогают осознать, во-первых, произвольный, т.е. связанный с
означивающие что-то, что может быть непосредственно воспринято выбором (не всегда эксплицирующим свои основания), характер
[190. Р.36], и 2) понятия, задаваемые через постулирование, т.е. соотнесения теоретических переменных с эмпирическими
понятия, значение которых полностью или частично определяется индикаторами и, во-вторых, вытекающую отсюда необходимость
постулатами дедуктивной теории, в которую они введены. Эти два разработки общей модели концептуализации измерения в
вида понятий определяют два языка, преобладающих на последова- причинных терминах. Последнее в общем случае означает посту-
тельных стадиях развития науки - естественноисторической стадии, лирование определенных причинных отношений между
характеризуемой ведущей ролью метода прямого наблюдения, клас- неизмеряемой переменной и ее индикаторами. Причем каждое из
сификации и дескриптивного анализа, и более продвинутой стадии таких постулируемых отношений должно быть заранее и
формулирования дедуктивной теории. Однако существенными для развернуто обоснованно через совокупность допущений. Эти
собственной концепции Блейлока оказываются не эти взгляды на допущения вытекают из содержательных соображений теории,
генезис научных понятий и стадии созревания науки, а то, как относящихся к процессам "реального мира", связывающим
Нортроп определяет характер соотнесения интуитивных понятии с индикатор и неизмеряемую переменную.
понятиями, заданными через постулирование. Прежде чем перейти к детальному анализу проблем
Отношением, соединяющим язык теории с обсервационным язы- концептуализации, косвенного измерения и "вспомогательных
ком, является эпистемическая корреляция - "отношение, соединя- теорий измерения" в данной статье и более поздних работах
ющее ненаблюдаемый компонент чего-либо, обозначенного через Х.Блейлока, нам необходимо сделать небольшое отступление и
постулируемое понятие, с его ("чего-либо") прямо наблюдаемым вкратце ответить на естественно возникающий вопрос: в чем все
компонентом, обозначаемым интуитивным понятием" [190. Р.119]. же состоит принципиальная новизна подхода Блейлока к проблеме
Т.е. эпистемическая корреляция соединяет вещь, известную одним измерения в социологии? Ведь и представление о латентной
способом, с той же по сути вещью, известной другим способом (делая переменной, и концепция теоретической валидности были
возможным, например, переход от массы как количества материи к введены ранее, и именно как реакция на существование
массе как "показанию стрелки"). Блейлок довольно детально анали- "пропасти" между теоретическими конструктами и
зирует обоснованность введения двух разных языков, отмечая, что операционально определенными индикаторами. Отчасти на этот
смешивание понятий теории и интуитивных понятий в одном языке
привело бы к появлению бессмысленных утверждений, скажем, о 30
Сам этот ход рассуждения довольно любопытен с точки зрения влияния "
94 адаптированных" сюжетов философии науки на ранние взгляды Блейлока и др. эмпирически
ориентированных социологов 60-х годов. В основание этого рассуждения уже встроена посылка,
что утверждения или гипотезу получают, комбинируя " всеми возможными способами"
исходные понятия.
вопрос ответил и сам Х.Блейлок в книге " Концептуализация и

95
измерение", вышедшей в 1982 г. Отмечая тесную, но не всегда строить гипотезы о характере причинных связей, которые в некото-
получающую должное внимание со стороны исследователей взаимо- рых случаях в принципе невозможно проверить? Для ответа на этот
связь между теоретической концептуализацией и решением сугубо вопрос нам представляется полезным привести один иллюстративный
технических или формальных проблем измерения, он пишет: пример. В статье по истории квантификации в социологии П.Лазар-
"... забота о концептуализации часто мотивирует или помогает сфельд [165] анализирует причины неудачи А.Кетле в измерении
рационализировать многие из более специальных дискуссий, наце- нефизических интеллектуальных и "моральных" характеристик че-
ленных на разработку формальных или аксиоматических оснований рез манифестные характеристики поведения, являющиеся следстви-
выбора модели измерения. Многие обсуждения проблем шкалирова- ем первых, не поддающихся прямому измерению. Отмечая, что
ния, как и посвященные шкалированию учебные курсы, имеют дело представления Кетле о косвенном измерении латентных качеств,
с процедурными вопросами "болтов и гаек", так что философскими представляющих теоретический интерес, и его теория измерения
и теоретическими основаниями часто пренебрегают или, по мень- социальных явлений значительно опередили свое время (притом,
шей мере, не доводят до достаточного уровня осознания явную заботу что, в силу свойственной социальным наукам "дисконтинуально-
о теории. Однако те, кто внес самый активный вклад в создание этих сти", не стали прямым основанием дальнейшей традиции социоло-
техник <измерения> - Л.Л.Терстоун, Пол Лазарсфельд, Луи Гутман, гического измерения), Лазарсфельд полагает, что трудности, с кото-
Клайд Кумбс, Роджер Шепард, Патрик Суппес, Р.Льюс, Амос рыми столкнулся Кетле при решении интересовавшей его проблемы,
Тверски и Дэйвид Кранц,- также были очень заинтересованы в были связаны с детерминистским характером его представлений о
проблеме сцепления между теоретически определенными конструк- связи неизмеряемой переменной и ее индикатора. Аргументация
тами и операциональными процедурами, хотя, возможно, они оп- Лазарсфельда построена на анализе конкретного примера измерения
криминальной тенденции ("Penchant au crime") [165. Р.305-309].
ределяли проблему другими способами. Так, Гутман (1944) пред- Изложив точку зрения Лазарсфельда, мы проанализируем этот
ставлял проблему в выборочных терминах, т.е. через отбор пунктов пример на языке "вспомогательных теорий измерения", что позволит
из содержательного универсума. Терстоун (1947), разрабатывая сделать более рельефным различие вероятностной, "симптоматиче-
обоснование для вращения осей в факторном анализе, сосредоточил ской" концепции измерения (Спирмен, Терстоун, Лазарсфельд) и
внимание на критерии экономности, стремясь прежде всего к "про- детерминизма причинных моделей измерения32 .
стой структуре". Лазарсфельд [1954) понимал эту проблему в тер- Кетле располагал данными об уровне преступности для боль-
минах латентных классов, внутри которых паттерны ответов в шого числа групп населения (выделенных по социально-демогра-
сущности случайны..." [89. Р.43 ]. Х.Блейлок здесь вводит, хотя и не фическим признакам - пол, возраст, образование и т.д.). При этом
заостряет, очень существенное различение между своим подходом и его не удовлетворяло чисто дескриптивное описание различий между
взглядами предшественников. И заключается оно в принятии детер- группами ("дескриптивных корреляций"). Он использовал свои оцен-
министских представлений о связи между неизмеряемой (в том ки уровня преступности как показатели скрытых наклонностей к пре-
числе, латентной) переменной и переменной-индикатором. Хотя в ступлению. Как отмечает Лазарсфельд, это давало Кетле преимуще-
отдельном случае окончательно определить или количественно оце- ство более драматического описания результатов и почву для теоре-
нить эту связь часто невозможно, ее надо отчетливо и заранее тической интерпретации [165. Р.305 ]. Большая частота убийств среди
специфицировать в модели измерения, как и все другие причинные молодежи, чем среди представителей старших возрастов, расценива-
связи31 . В противном случае нельзя отличить ошибки субстантивной лась как свидетельство "насильственной природы молодости", более
теории от ошибок, связанных с теоретическим обоснованием изме- высокий уровень преступности среди мужчин - как проявление "ог-
рения, а зачастую - и заподозрить их существование (т.е. детерми- раниченной природы женской личности" (которая сама по себе не
низм здесь выступает как норма исследовательского подхода, а не поддается прямому измерению). Кетле осознавал уязвимость для
как онтологический постулат о том, "как обстоят дела на самом критики применяемого им метода эмпирического обоснования выво-
деле"). На первый взгляд, различие взглядов Х.Блейлока и, напри-
мер, П.Лазарсфельда, наиболее последовательно развивавшего пред-
ставления о вероятностной природе отношений теоретической пере- 7 И.Ф.Девятко 97
менной и ее индикатора, не так уж велико, а идея спецификации
всех причинных связей в модели измерения, когда заведомо извест-
но, что некоторые из них вообще не могут быть оценены численно, 32
кажется не вполне обоснованной. Не проще ли принять вероятност- Можно следующим образом определить суть детерминистской критики вероятностного
ную парадигму отношения индикатора к латентной переменной, чем подхода: никакая теория измерения, связывающая теоретический конструкт и эм-
пирический индикатор, не может быть построена как обобщение формальных допущений
96 моделей латентно-структурного или факторного анализа. Применение послед
них само может быть обосновано лишь через уже заданную теорию измерения, связанную с
проверяемой содержательной теорией (описывающей релевантные характеристики
социальной реальности, относительно которых оценивается обоснованность допущений).
31
Поэтому представления о вероятностном выводе относительно латентного континуума или
Предположение о причинной связи между неизмеряемой переменной и эмпирическим "универсума признаков", являясь гипотетическими моделями процесса измерения не
индикатором может быть истолковано как исключительно методологический принцип, о могут быть обоснованы теми техниками измерения, которые послужили «поводом» для
чем будет говориться далее в этой же главе. их появления.
да о неизмеряемых переменных (тенденциях, склонностях) и посто- ется сама по себе бесполезна для выявления нелинейности этой
янно стремился найти контраргументы (фактически вводя новые связи. Напротив, объясняя в обоих случаях,) почему отношение
допущения в свою "теорию измерения"): оказалось нелинейным, Лазарсфельд просто вводит дополнительные
1) верно, что число совершенных преступлений не равно числу объясняющие переменные в причинную модель, делая ее более
преступников, но так как бдительность полиции можно считать сложной, но не индетерминистской (в случае теста - это зависимость
приблизительно постоянной (для разных групп), то это не играет формы кривой от различающей мощности вопроса, в случае числа
роли при сравнении криминальных тенденций по возрастным или рождений - это влияние на конечный исход, помимо "тенденции
каким-либо другим социально-демографическим группам; иметь мальчиков", "тенденции продолжать рождения до появления
2) верно, что криминальная тенденция проявляется при опреде- мальчика", которая делает сверх-представленным потомство семей,
ленных обстоятельствах и не проявляется при других, т.е. мы имеем имеющих биологическую склонность к рождению девочек). Суть
дело с "Penchant apparent" а не с "Penchant reel", но для сравнитель- здесь, оказывается, не в вероятностной природе самой связи, а в
ных целей обе равно пригодны (Кетле проводит "эмпирическую нелинейности зависимости конкретного эмпирического индикатора
проверку" этого допущения, сравнивая распределение числа либо в присутствии неучтенной объясняющей переменной (которую в
обвинений, приговоров и оправданий для разных возрастных принципе можно включить в нашу причинную модель измерения,
групп); если мы ее эксплицитно рассматриваем, и найдя для этой неучтенной
3) действительно, отсутствует возможность сравнить данные со- переменной независимый индикатор, вычленить чистый эффект
циальной статистики по всему населению с данными по преступни- интересующей нас "тенденции"). Суммируя, можно сказать, что
кам (Кетле не располагал, например, статистикой образования), но Лазарсфельд прав, отмечая сверхупрощающий и часто вводящий в
можно снова применить относительные оценки, например, построить заблуждение характер сделанного Кетле допущения о прямой линей-
кросс-классификацию преступников по полу и образованию. ной связи неизмеряемой тенденции и ее манифестации 33 , но ошиба-
Однако, пишет Лазарсфельд, все это еще не решает главной ется, когда считает, что нелинейный (1-й пример) и мультикаузаль-
проблемы: "Что предполагается, когда делается вывод от со- ный (2-й пример) характер нашей модели измерения делает обосно-
вершенных преступлений к криминальной тенденции? Сделал ли ванным, теоретически или из практических соображений, постулат о
Кетле нечто большее, чем просто заменил словами "криминальная вероятностной природе измерения. И собственный ход рассуждений
тенденция" наблюдаемые оценки преступности?" [165. Р.306]. С Лазарсфельда демонстрирует, сколь существенны для выбора
точки зрения Лазарсфельда, Кетле принял детерминистскую модель: формальной модели, описывающей характер отношений между
"причина (тенденция к преступлению в данной группе) - следствие доступными нам индикаторами и измеряемыми латентными
(доля совершивших преступления в этой группе)", тогда как в характеристиками, содержательные представления о причинных
социальных науках типичной является вероятностная связь между связях "реального мира", вытекающие из теории явления (хотя,
индикаторами (симптомами) и гипотетическими конструктами. еще раз это , подчеркнем, результирующая формальная модель
Какова, с точки зрения Лазарсфельда, природа этих вероятност- может оперировать и вероятностями).
ных отношений? Оказывается, они необходимо связаны с нелиней- Интересно отметить, что "стохастическая" аргументация никак ,
ностью отношения "тенденция - симптом". Объясняя причину, по не соотнесена в данном случае с проблемой конструктной валидности
которой Кетле не смог отказаться от детерминистской модели в измерения, которую Лазарсфельд также затрагивает в данной статье
пользу вероятностной, Лазарсфельд указывает на аксиоматически [165. Р.307-308]. В сущности, конструктная валидность - т.е.
принимаемое Кетле допущение "пропорциональности причин и обоснованность связывания гипотетического конструкта теории с
следствий", т.е. в терминологии самого Лазарсфельда, предпо- данным эмпирическим индикатором, - явно избыточное понятие с
ложение о линейных отношениях между латентным континуумом, точки зрения последовательно "вероятностного" подхода. В общем
который пытается измерять Кетле, и вероятностью индикатора, случае любой тест, не обладающий конструктной валидностью, может
который он может наблюдать. Далее Лазарсфельд без труда де- иметь ненулевую вероятность "положительного" ответа на него в
монстрирует на примерах, что график, операциональная характе- любой точке латентного континуума. Рассуждение Лазарсфельда об
ристика наблюдаемого индикатора на латентном континууме, может условиях, при которых допустим вывод от наблюдаемого поведения
иметь любую форму, помимо линейной. Но в обоих приводимых им (доля преступлений в данной группе или при данных социальных
вымышленных примерах (теста конформности по отношению к обстоятельствах) к причине, т.е. к "преступным тенденциям" (на
моральным нормам и измерения "репродуктивной стратегии микроуровне анализа - мотивационным состояниям принадлежащих к
семей", имеющей результатом определенное число рождений этой
мальчиков и девочек) хотя и наличествует безусловно нелинейное 7* 99
отношение гипотетической переменной и индикатора, сама нелиней-
ность не выводится из постулата вероятностной связи. Т.е.
вероятностная трактовка связи " тенденция - симптом" оказыва- 33
Пример с долей рождений мальчиков действительно показывает, что связь причины -,
тенденции и ее следствия - индикатора может быть обратной, т.е. при всех принятых
98 допущениях о причинных связях в модели измерения следствием будет меньшее ожидаемое
число рождений мальчиков (и большее среднее число рождений девочек).
группе индивидов), по существу показывает, что модель Кегле была случайных факторов (не скоррелированных с X возмущений, разброс
недостаточно детерминистской, т.е., говоря современным языком, которых будет уменьшаться по закону больших чисел с ростом числа
Кегле не специфицировал все причины, влияющие на исследуемых случаев). Эта ситуация изображена на рис. 8 (для
интересовавшую его теоретическую переменную и ее поведенческий большей наглядности кружком здесь и далее обведены неизмеряемые
индикатор. В результате Лазарсфельд от "вероятностной" модели переменные, а квадратом - измеряемые). Однако, если мы хотим
измерения и критики детерминизма в социологическом измерении далее сравнить значения Х1 в разных группах (или разных субкуль-
переходит к каузальному анализу, как только возникает турах) , нам нужно 1) решить, как составить полный список альтер-
необходимость объяснить, в чем на самом деле заключалась нативных форм преступного поведения, т.е. всех возможных видов
"проблема Кегле". Он указывает, что так как измерение преступлений, и выбрать критерий их включения или исключения
криминальной тенденции является "внутренней" процедурой и (скажем, обращение жертвы в полицию и официальная регистрация
внешний критерий валидации используемого поведенческого факта преступления) , 2) найти способ их агрегирования, т.е. подсче-
индикатора отсутствует, то уже на стадии концептуализации нам та, заранее решив, что для получения сводного показателя альтер-
придется искать разные индикаторы помимо уровня преступности нативные виды преступного поведения должны суммироваться или,
(проявления неуважения к закону, агрессивность). И кроме того, скажем, перемножаться. Допустим, мы имеем полные списки видов
если мы включим в их число долю действительно совершенных преступлений для двух групп, например низкоквалифицированных
преступлений, мы уже не сможем узнать, каково эмпирическое фабричных рабочих и представителей "свободных профессий" с
отношение между криминальными тенденциями, измеренными высоким доходом. Предположим также (не очень реалистически),
независимо, и частотой преступлений, совершенных в разных что мы располагаем полными данными для двух выборок из этих
группах и при различных социальных обстоятельствах [165. Р.308]. групп о частоте совершения ими каждого вида преступлений из
Лазарсфельд отмечает, что Кегле проводит разграничение между наших списков. Вполне возможно, однако, что в списке для второй
общей криминальной тенденцией, умением осуществить группы намного меньше видов преступлений, чем в списке для
преступление определенного типа и возможностью его осу- первой группы (скажем, в нем отсутствуют убийства в пьяных драках
ществить при определенных обстоятельствах. Однако уверен- и мелкие кражи). Мы, вероятно, захотим предположить, что воз-
ность Кегле в том, что в его сравнительных оценках уже учтены можно какое-то "замещение" одного типа преступного поведения
(поддерживаются на постоянном уровне) умение, возможность и другим (джентльмен, скажем, не убьет свою жену, но с помощью
вероятность обнаружения, помешала ему осознать необходимость хитроумного мошенничества серьезно заденет ее финансовые инте-
найти меру криминальной тенденции, независимую от самого пре- ресы). Как мы можем получить сравнимые численные показатели
ступного акта. Таким образом, ПЛазарсфельд, поначалу обосновы- для двух этих групп (если "криминальные тенденции", относительно
вающий в рассматриваемой статье вероятностную природу косвен- которых мы могли бы "взвесить" преступления из двух списков, по-
ного измерения (как соотнесения гипотетического конструкта теории прежнему остаются прямо не измеряемыми)?
и измеряемого индикатора), вынужден постоянно эксплицировать Вернемся, однако, к предположениям, сделанным для простейшей
предположения о причинных связях "реального мира", включенных ситуации, изображенной на рис. 8. Не обсуждая проблем межгруп-
в конкретную ситуацию косвенного измерения. Т.е. то, что он считал повой сопоставимости индикаторов, т.е. считая их каким-то образом
излишним "в принципе", оказывается неизбежным практически. решенными, введем определенное усложнение в нашу модель. До-
Отличительная же особенность подхода, развиваемого Х.Блейло- пустим, что навыки, необходимые для свершения какого-то вида
ком, - постоянное подчеркивание необходимости заранее, основыва- преступления (У), и возможности его совершить (P), зависящие от
ясь на имеющихся теоретических представлениях, строить причин- конкретной ситуации и вероятности быть уличенным, также влияют
ную теорию, связывающую постулируемые свойства с какими-то на наш эффект-индикатор, т.е. имеет место ситуация, изображенная
индикаторами, которые мы можем наблюдать относительно непос- на рис. 9.
редственно. Очевидно, в этой ситуации нам нужно скорректировать нашу
Рассмотрим "проблему Кегле" с точки зрения такого подхода меру преступной тенденции, статистически проконтролировав Y и
(заведомо ограничившись лишь теми трудностями, о которых говорит P, что возможно лишь если У и P достаточно хорошо измерены.
в своей статье ПЛазарсфельд и которые в значительной мере Последнее требование еще более важно, если мы предположим
осознавал сам А.Кетле). В некоторой простейшей ситуации можно наличие между независимыми переменными существенной корреля-
считать, что единственной причиной определенного индикатора (ко- ции: даже чисто случайная, но существенная ошибка измерения в
торый мы обозначим как эффект-индикатор, в отличие от индика- одной из этих независимых переменных не только сдвинет к нулю
тора-причины) является переменная, которая и представляет "ее" коэффициент в уравнении множественной регрессии, но и в
теоретический интерес для исследователя. Т.е., применительно к случае высокой скоррелированности этой независимой переменной с
рассматриваемому нами случаю, криминальная тенденция X другой будет приводить к завышенной оценке влияния этой второй
является единственной причиной уровня преступности Xv не считая
каких-то
100 10
1
переменной. Однако Кегле не располагал возможностью измерить У
и P, да и сейчас едва ли возможно это сделать, не вводя для них
каких-то косвенных индикаторов, которые еще больше усложнят эту
модель (если мы захотели использовать, скажем, экспертные
оценки для навыков совершения преступлений определенного вида,
нужно было бы ввести ряд допущений, касающихся разброса сужде-
ний, сходства критериев, используемых экспертами и т.п.). Поэтому
Лазарсфельд и предложил найти независимую меру X, т.е. Х2
-некий индикатор преступной тенденции, отличный от самого пре-
ступления и не зависящий от Y и P. Если бы такой индикатор Х2
можно было бы найти, возникла бы уже теоретическая проблема
обоснования его конструктной валидности (скажем, таким индика-
тором оказалась бы частота поведенческих проявлений неуважения
к старшим).
Введем еще одно усложнение в ситуацию, представленную на
рис. 9. Допустим, прежний уровень криминальной тенденции X (в
более ранний момент времени) влиял на различия в преступных Рис.8
навыках Y между двумя нашими группами (рабочих и представи- Рис. 8. Модель с одним индика-
телей "свободных" профессий), а различие в навыках, в свою тором для " проблемы Кетле".
очередь, влияло на возможность совершения преступления. Кроме
того, прежнее значение уровня преступности Х1 может через меха- Рис.9. Модель с двумя из-
меряемыми и одной неизмеряемой
низм обратной связи влиять на последующее значение криминальной переменной.
тенденции X (такое предположение вполне правдоподобно, если
допустить, что криминальное поведение в определенной мере явля- Рис. 10. Усложненная модель с
ется "социально выученным"). Упрощенная схема для этого случая обратной связью.
представлена на рис. 10. Еще более сложной будет ситуация, когда
различие в значениях переменной P (возможностей, случаев, благо- менной, в причинных моделях измерения должны делаться и
приятных для совершения преступления) для двух наших групп в некоторые предположения, касающиеся вариативности (или
момент времени t - I каким-то образом, через различия в приобре- константности) этой связи. Поэтому еще одной темой, изначально
тенном опыте, навыках или в практике социализации представите- включенной
лей двух этих групп, влияет на "криминальную тенденцию" в в обсуждаемый круг идей, является обоснованность принятия
момент t. Как мы можем измерить "криминальную тенденцию" в «предположения о гомогенности». Эта тема легко может быть
этих двух ситуациях? Конечно, существуют способы, позволяющие проиллюстрирована на примере сравнительных исследований или
при определенных условиях и допущениях справиться с мультикау- измерения опосредующих переменных. Пока же, лишь
зальностью и нерекурсивностью в причинных моделях косвенного очерчивая ее общие контуры, вернемся к рассмотренному
измерения. Но если отношения индикаторов к теоретическим конст- примеру. В этом преступлений в группе - это эффект-индикатор
руктам заранее не определены в теоретической системе, т.е. Преступной тенденции. Но предположим, что мы сочли
"вспомогательная теория измерения" не определена столь же отчет- излишним понятие "криминальной тенденции" и хотим сравнить
ливо, как и содержательные теоретические гипотезы, исследователь, лишь сами уровни преступности34. Пусть Х1 - наблюдаемая частота
идеализирующий ситуацию измерения, не сможет отделить откло- преступлений, являющаяся какой-то частью истинного уровня
нения полученных результатов, вызванные неадекватностью этой преступности, т. е. истинной частоты X. Истинное значение X
идеализации, от ошибок теоретического прогноза. соответствует полному но не измеряемом уровню
В обсуждавшейся выше статье 1968 г. Х.Блейлок замечает, что преступности, а Х1 - числу преступлений, зарегистрированных
меньшая, в целом, острота проблем измерения в естественных официально (по которым было возбуждено уголовное дело). В
науках отчасти связана с замечательной константностью фундамен- таком случае мы можем считать, что Х 1 равно истинной
тальных физических величин. В науках социальных, напротив, величине X, умноженной на какую-то Величину U. Можем ли мы
считать эту последнюю величину константой? Лишь в очень
постоянно следует считаться с вариативностью эмпирических соот- ограниченном числе случаев при соблюдении целого ряда условий.
ношений. Наряду с проблемами мультикаузальности, наличия меха- В общем же, U - это переменная, значения которой будут изменятся
низмов обратной связи между индикатором и неизмеряемой пере- от ситуации к ситуации, от одного типа преступлений к
102
34
Этот пример рассматривается Х.Блейлоком в работе [84. Р.89]
другому (достаточно сравнить квартирные кражи и вымогательство)
и в зависимости от социальных характеристик обвиняемого или
осужденного. Так, значения U могут быть намного меньше
"беловоротничковой" преступности в сравнении с преступностью
уличной. Поэтому попытка представить отношения X и Х1 в виде
уравнения:
Х1 = a1+ b1X
103
и считать U константой будет вести к заблуждениям. Конечно, в принимаемых при использовании номинальных шкал и
ситуации, когда истинное значение X неизвестно, можно использо- соответствующих методов анализа данных. Проблемы же, возникающие
вать многоиндикаторный подход, но и в этом случае следует сделать при использовании номинальных шкал и категориальных данных (даже
определенные теоретические предположения о всех U., соединяю- столь простых, как "пол", "партийность" или "вероисповедание") и
щих X и X. -и индикатор, и постараться получить на этой основе связанные прежде всего с многомерностью этих категорий, часто
какие-то прямые измерения этих U. Можно использовать для этого остаются вне области интересов исследователей и немногим реже - вне
специальное методическое исследование, посвященное сравнитель- сколь-нибудь ясного осознания.
ному анализу статистики преступлений, зарегистрированных в резу- Оценка размерности для номинальных переменных является до-
льтате обращения их жертв, добровольных явок с повинной, числа вольно редкой процедурой в конкретных социологических исследо-
осужденных за различные виды преступлений среди представителей ваниях. Поэтому социологи нередко предпочитают использование
различных социальных групп и т.п. В ином случае, когда имеет место неупорядоченных "именных" категорий попыткам выделить какой-либо
некритическое принятие "предположения о гомогенности", это критерий, позволяющий упорядочить используемые категории I на
обесценивает результат самого масштабного и интересного по замыслу одномерном континууме и достигнуть ординального уровня
исследования35. измерения. Такая стратегия, однако, делает невозможным обоснование
Как пишет Х.Блейлок в другой своей книге [90. Р.128-138], сравнимости показателей, например в повторных исследованиях.
существующая терпимость социологов к глобальным обобщениям, Скажем, такие номинальные категории, как "протестант" или "ква-
построенным на весьма ненадежных и чаще всего "выносимых за лифицированный профессионал", часто включаются в теоретическое
скобки" предположениях о содержательной стороне осуществленных объяснение в качестве биографических, экзогенных факторов, каким-то
ими измерительных процедур, может объясняться лишь недостатками образом связанных с переменными жизненного опыта, влияющими на
сложившейся в эмпирической социологии интеллектуальной поведение или установки индивидов. Допустим, исследователь
культуры. предположил, что конгрегационалисты, баптисты и квакеры могут быть
объединены как "протестанты", чьи политические ориентации, в силу
какой-то специфики жизненного опыта, могут быть сопоставлены с
2. Взаимозависимость концептуализации и измерения: политическими ориентациями католиков или мусульман. Если он
случай использования категориальных переменных сравнивает результаты своего исследования с результатами идентичного
в социологическом анализе по методике исследования, проведенного 10 или 30 лет назад, то может
Тезис о тесной связи теоретических и специально-методических ли он считать их сравнимыми лишь на том основании, что словесные
проблем социологического исследования, о невозможности даже "ярлыки" его номинальных категорий не изменились? В большинстве
кумулятивного накопления чисто эмпирических результатов без случаев ответ будет отрицательным, так как неявно предполагаемая и
существенного прояснения теоретических понятий в социологии скрытая за номинальной ; "религиозной" группировкой переменная
можно считать своего рода "общим местом". Новизна подхода жизненного опыта скорее всего не обладает стабильностью в таких
Х.Блейлока - в систематическом анализе того, как можно прояснить временных интервалах. Аналогичная проблема возникает и в кросс-
природу этой связи, строя "вспомогательные теории измерения". культурных исследованиях, когда предполагается, например, что
Осуществляемый Х.Блейлоком разбор проблем концептуализа- "профессионалы", независимо от конкретного рода занятий или
ции, возникающий при использовании категориальных переменных государственных границ, имеют сходные ролевые ожидания, и
[89.' Р.109-145], интересен как образец такого систематического "профессионализм" используется как объясняющая переменная для
анализа, направленного на чрезвычайно распространенные и часто построения общей теоретической модели.
воспринимаемые как самоочевидные процедуры анализа данных и Если исследователь прибегнет к другой стратегии и попытается
интерпретации. упорядочить номинальные группировки по какому-то одному изме-
Интерес социологов к категориальным данным и классификациям рению, то возникает другая опасность - смешивания с другими ;
можно объяснить целым рядом причин: и преимущественно дескрип- "закоррелированными" измерениями, предполагающими совершенно
тивной ориентацией, связанной с отсутствием достаточно общих иную теоретическую интерпретацию. Например, упорядочение
теорий; и неразработанностью фундаментальных проблем измере- религиозных деноминаций по степени "фундаментализма" может быть
ния; и заинтересованностью в интерпретации исторических событий сильно связано с их ранжированием по престижности. Или
и "жгучих" проблем современности; и не слишком обязывающим и упорядочение профессий по престижности окажется очень сходным с
легко согласуемым со здравым смыслом характером предположений, их упорядочением по среднему уровню образования. Если иссле-
дователь далее обозначит свою объясняющую переменную как рели-
104 гиозный фундаментализм или профессиональный престиж, то
105

35
Истории осознания этой проблемы в социологии много внимания уделяет, например,
Э.Мокжицкив [153] (особенно гл.7,8).
полученная в результате теоретическая интерпретация будет совер- тем сильнее принимаемые нами предположения и допущения и
шенно отлична от интерпретации в терминах религиозного престижа выше вероятность желаемого результата, но в то же время -
или среднего уровня образования [89. Р. 113-114]. тем вероятнее ошибки интерпретации [89. Р.135].
В большинстве случаев, отмечает Х.Блейлок, самой целесообразной Какой может быть общая стратегия концептуализации и
стратегией оказывается введение серии промежуточных переменных построения "вспомогательной теории измерения" при
(даже если они не могут быть непосредственно измерены) и использовании типичных для социологического исследования
формулировка теоретических гипотез в терминах этих промежуточ- объясняющих переменных? Пожалуй, самым распространенным
ных переменных, а не самих по себе номинальных "социально-де- в эмпирических исследованиях типом объяснения
мографических факторов". Тогда религиозная принадлежность или (определяющим, соответственно, "набор" измеряемых
род занятий индивида будут включены во вспомогательную теорию переменных) является связывание "фоновых" биографических
измерения как причинные индикаторы определенной переменной факторов либо с установками, ценностями и другими - "
жизненного опыта или знаний, получающей определенный балл в внутренними" переменными, либо с наблюдаемым поведением.
соответствии с вероисповеданием или профессией. В результате, Преимущества такого подхода, с точки зрения измерения,
например, протестант получит высокий балл по одному измерению, очевидны, так как и зависимая, и объясняющая переменные в
промежуточный - по другому и низкий - по третьему. Сходным этом случае обычно имеют несколько индикаторов, а для
образом профессиональная принадлежность получит численные обоснования и оценки эмпирической валидности и надежности
оценки по нескольким измерениям, зависящим от рода занятий существуют сравнительно простые и достаточно разработанные
(экономическая власть, социальный престиж и так далее). При методы. Однако много-численные эмпирические исследования,
проведении сравнительных исследований теоретически определен- основанные на схеме "социально-демографическая переменная
ные переменные будут сохранять свою тождественность, хотя сис- - установки/поведение", привели не только к созданию общей
тема численных оценок вполне может изменяться. Например, про- теории "социально-бытийной детерминации сознания или
фессии будут иначе ранжированы по "надежности дохода", а опре- поведения, но и к накоплению сколько-нибудь
деленное вероисповедание окажется более "фундаменталистским" в непротиворечивых и сопоставимых фактов, касающихся кон-
одном обществе, чем в другом. кретных форм поведения и установок.
Разумеется, такой подход требует проведения специальных мето- С точки зрения Х.Блейлока, недостаток таких исследований
дических исследований, позволяющих получить численные оценки -имплицитность, неразвернутость теоретических представлений
"проекций" биографических номинальных переменных на каждое из о природе связи этих двух типов измеряемых переменных.
релевантных измерений опыта [89. Р.134-135]. Располагая резуль- Обычно, связывая, например, социально-экономический статус
татами таких исследований, социолог, проводящий конкретный оп- или место жительства с политическим
рос, действительно мог бы ограничиться простыми вопросами, каса- консерватизмом/либерализмом, исследователь предполагает,
ющимися рода занятий или вероисповедания, так как ответы на эти что существует какая-то переменная жизненного опыта,
вопросы могли бы далее получить некоторые числовые оценки, опосредующая эту связь. Однако эти переменные опыта,
основанные на уже имеющейся информации. Тогда словесные "яр- определяющие способ влияния биографических факторов на
лыки", включающие прилагательные "профессиональный" или "ре- установки или поведение индивида, очень редко
лигиозный", могли бы использоваться как сокращенные обозначения концептуализируются заранее, появляясь, в лучшем случае, при
конкретных измерений, таких, как профессиональный престиж или интерпретации результатов. Например, "различия в установках
религиозный фундаментализм36. Таким образом, "одна и та же" черных и белых американцев по отношению к реформе
номинальная шкала могла бы использоваться при получении орди- образования могут быть связаны с различиями в условиях
нальных оценок для нескольких достаточно общих теоретических социализации в родительской семье либо с различиями в
переменных, хотя такое использование категориальных переменных экономических ресурсах этих групп, создающими стартовое
потребовало бы специальных мер предосторожности, направленных неравенство при переходе к новой системе образования..." (наш
против потенциального смешения идентифицированных в модели пример вымышлен, однако найти реальные не составляет труда).
переменных с неучтенными и неизмеряемыми факторами37. Здесь, по Если бы эти переменные опыта были заранее
мнению Х.Блейлока, мы сталкиваемся с фундаментальной дилем- концептуализированы и, если это возможно, измерены, то
мой, сходной с поставленной К.Кумбсом [110]: знаем ли мы то, что основания для связывания непосредственно наблюдаемых типов
хотим, или хотим знать? Чем выше наши "амбиции" в измерении, поведения или установок с "паспортными" данными были бы
106
значительно прочнее. Более того, даже если переменные опыта,
введенные во вспомогательную теорию измерения, сами не могут
36
быть измерены с удовлетворительной точностью, становится
В качестве примера такого подхода Х.Блейлок приводит социально-экономический возможным сформулировать серию теоретических
индекс престижа профессий О.Дункана [119]. предположений, которые вместе с допущениями о характере
37
Более детально эта проблема рассматривается в [87; 89, ch.6]. связи "опытных" и биографических переменных будут вести к
верифицируемым гипотезам, косвенно подтверждаю- 107
3) Мера наличия у деятелей существенных ресурсов. Вне зави-
щим или опровергающим теоретическую концепцию исследования симости от природы и сути адресованных индивидам экспектаций,
[89. Р.142-144 ]. Следовательно, необходим некоторый список доста- статус или уважение получают те, кто способны им соответствовать.
точно общих размерностей или факторов опыта, которые в каждом Какая бы "фоновая" переменная не служила источником этих
конкретном случае могли бы быть соотнесены и с биографическими ресурсов (биологическая наследственность, обучение, интериориза-
переменными, и с интересующими исследователя типами поведения ция форм поведения из микросоциального контекста или какая-то
или установками. Эти общие размерности опыта должны быть другая), те деятели, которые не обладают этими ресурсами, окажутся
достаточно неспецифическими и "бессодержательными", чтобы до- в ситуации дефицитарности. Однако (и здесь проявляется ограни-
пускать в разных ситуациях конкретизацию и использование в ченность упрощенной схемы "происхождение - успешность в дея-
качестве объясняющих переменных для самых многообразных форм тельности") собственное восприятие субъектом своих ресурсов будет
поведения. взаимодействовать с реальным уровнем успешности, влияя на уро-
Помимо такого списка измерений опыта, проводящий конкретное вень притязаний, "Я-концепцию", которые, в свою очередь, будут
исследование социолог должен будет учесть степень значимости или оказывать обратное воздействие на успешность деятельности.
релевантности каждой биографической переменной для каждого 4) Мера, в которой субъект подвергался трудностям,
измерения опыта в данной ситуации. Например, "пол" может быть конфликтам, угрозам. Очевидно, что независимо от конкретных
релевантным в ситуации А и иррелевантным в ситуации В. Т.е. особенностей изучаемой ситуации, некоторые группы испытали
степень релевантности какого-либо социально-демографического меньше угрожающих или конфликтных переживаний, чем другие -
фактора также должна быть эксплицитно включена в модель изме- включая открытые конфликты, абсолютную либо относительную
рения. Х.Блейлок осуществил первую попытку составить такой депривацию и так далее. Например, некоторые возрастные когорты
общий перечень измерений опыта, которые могут быть использованы испытали последствия трудностей военного времени или
во вспомогательных теориях измерения [89. Р.135-142 ]. Рассмотрим экологического кризиса, которых не испытали другие. Такие
основные типы таких переменных опыта. комулятивные переживания (а не сам по себе биологический
1) Уважение или статус, предоставляемые референтными груп- возраст) будут проявляться в установках и поведении, особенно в
пами. Это достаточно общий для самых разнообразных ситуаций тип ситуациях, имеющих смысловую соотнесенность с этими
переменных опыта, связанный со степенью получаемого субъектом переживаниями.
статуса или уважения (независимо от конкретных форм его выраже- Кроме описанных, Х.Блейлок выделяет и другие потенциально
ния) . По сути он задает некоторую ординальную позицию субъекта релевантные измерения опыта, связанные с биографическими пере-
на континууме престижа по отношению к совокупности других менными и влияющие на установки или поведение: гомогенность
субъектов. В некоторых случаях такие переменные статуса имеют поведения индивидов, имеющих общую групповую принадлежность;
специфическую метрику (например, размер денежного вознаграж- степень зависимости статуса от успешности; "проницаемость" рефе-
дения), но чаще всего подразумевают какое-либо ранжирование. рентных групп; степень совместимости ожиданий с опытом социали-
Конкретные ситуации А и В могут, однако, отличаться дифферен- зации и раннего научения; возможность "ухода" из группы (иногда
цированностью рангов, степенью явной заданности критериев ран- можно сменить этническую группу и практически никогда - расовую
жирования, выраженностью конкуренции в борьбе за статус и так идентичность); количество предоставляемой субъекту эмоциональ-
далее. При этом перечисленные факторы будут выступать в качестве ной поддержки; наличие драматических или плавных изменений в
отдельных измерений данной переменной опыта, оказывающих раз- "истории жизни".
личное влияние на представителей разных социально-демографиче- Разумеется, этот список неполон, однако он очень важен для
ских групп. очерчивания сферы переменных опыта, соответствующих многооб-
2) Согласованность экспектаций, связанных с поведением. Мож- разию ситуаций и типов поведения, которые представляют интерес
но выделить несколько измерений, связанных с этой общей перемен- для социолога. Спецификация этих переменных опытаj во вспомога-
ной (безотносительно к специфическому содержанию этих экспек- тельной теории измерения позволяет осуществить по крайней мере
таций): наличие (или отсутствие) различных групп, имеющих приближенное ранжирование вдоль "опытного" континуума субъек-
несовместимые ожидания по поводу поведения личности; ограни- тов, имеющих различные значения релевантных биографических
ченность ресурсов, делающая невозможным одновременное следо- переменных (даже в том случае, когда исследователь лишен возмож-
вание согласованным экспектациям; предсказуемое и контролируе- ности прямо или косвенно измерить переменную опыта).
мое либо случайное и находящееся вне контроля индивидуального Этот подход, однако, сталкивается с трудностями в тех случаях,
деятеля изменение социальных экспектаций во времени. Приме- когда существует много релевантных измерений опыта, часть кото-
ром теорий, связывающих несогласованные или несовместимые со- рых взаимодействует друг с другом, и сравнительно малое число
циальные экспектаций с социально-демографическими переменны- категорий биографической переменной. Х.Блейлок приводит следу-
ми и поведением является теория "рассогласованности статусов". ющий пример: если чернокожие американцы одновременно испыты-
109
108
вают ситуации, в которых не имеют достаточного доступа к ресурсам, психосемантике), то в социологии эта проблема стала предметом
в которых социальные ожидания рассогласованы, в которых они специальных исследований к концу 60-х - началу 70-х годов (напри-
постоянно получают низкий статус, и если они имеют в среднем мер, в работах Г.Костнера, Р.Хаузера и А.Гольдберга и др., прово-
значительно больший "трудный" опыт, то на уровне интерпретации дившихся преимущественно в рамках многоиндикаторного подхода,
становится крайне трудно решить, какой из этих взаимодействую- рассмотренного в предыдущей главе).
щих механизмов оказывает первичное влияние на их установки и Здесь мы затронем лишь проблему сравнимости измерений, хотя
поведение. В этой ситуации исследователь должен найти подгруппу, утверждения о несопоставимости часто относятся либо к неэквива-
"нагруженную" лишь по некоторым измерениям опыта (и оценить лентности "личностных смыслов", т.е. коннотативных компонентов
чистый эффект остальных). Полезным приемом является и деком- значения, либо к несопоставимости, возникающей в процессе обобщения
позиция укрупненных номинальных категорий: скажем, переход от в результате действия неконтролируемых переменных. Последние два
пяти-шести объединенных категорий "рода занятий" х детализиро- типа аргументов обычно вполне обоснованны и служат предметом
ванному списку 50-60 профессий, которые можно будет дифферен- анализа в психосемантике, изучающей индивидуальные системы
цировать по нескольким измерениям опыта согласно усредненным значений (см., например: [58]), и в работах, посвященных
значениям соответствующих "опытов" их представителей. планированию квазиэкспериментальных исследований [31 ]. Принято
Таким образом, даже если прямое измерение переменных опыта считать, что проблема сравнимости измерений возникает в ситуации,
оказывается практически невозможным, они могут и должны быть когда измерение носит косвенный, непрямой характер (т.е.
сохранены в теоретической гипотезе и интерпретации при соблюде- отношение между теоретическим концептом и наблюдаемой пере-
нии некоторых условий: достаточно большого числа категорий био- менной явно опосредовано теоретически специфицированным эмпи-
графической переменной (относительно гомогенных по релевантным рическим конструктом), а вспомогательные теории измерения могут
измерениям опыта); возможности дать усредненную оценку опыта варьировать в зависимости от условий или контекста. Вопрос становится
каждой категории (если не на индивидуальном, то на групповом еще сложнее в случаях, когда вспомогательная теория измерения
уровне); наличия достаточно четких теоретических гипотез, соотно- включает те же переменные, которые, уже в качестве теоре-тических
сящих выделенные переменные опыта с общими типами поведения концептов, включены в основную содержательную теорию, что приводит
или установок. Следовательно, эта стратегия улучшения социологи- к смешиванию теоретических и "измерительных" проблем.
ческого измерения требует и хороших субстантивных теорий, и Например, какой-либо из биографических факторов (пол или
эксплицитных вспомогательных теорий измерения, связывающих социально-экономический статус) может приводить к систематической
переменные опыта с биографическими и поведенческими измеряе- ошибке измерения и в то же самое время быть причиной или
мыми переменными. следствием тех переменных, которые исследователь стремится
измерить. В этом случае, чем менее отчетливо определена вспомо-
гательная теория измерения и чем сложнее основная теория, тем
3. Некоторые аспекты сравнимости измерений невозможнее атрибутировать различия, возникающие при сравнении
Поскольку процесс измерения предполагает создание операцио- измерений (между условиями, временными периодами или индивидами).
нального языка, делающего объекты измерения сравнимыми в терми- Т.е. однозначно приписать эти различия к истинным содержательным
нах этого языка, утверждения о несопоставимости измерений для или вызванным артефактами измерениям.
различных групп, культур или ситуаций являются весьма веским Проблема сравнимости измерений имеет целый ряд аспектов:
аргументом, часто используемым критиками эмпирической социоло- использование общих индикаторов в многоиндикаторном анализе и его
гии (см., например: [183]). Однако эти утверждения часто бывают ограничения [89. Р.76-85; 200]; нелинейные отношения между
конструктом и индикатором, вариабельность коэффициентов в
столь общими и неспецифицированными, что исключают возмож- структурных уравнениях (как в примере с "беловоротничковой"
ность конструктивного диалога. Примером такого рода утверждений преступностью на с. 101) и другие. Мы ограничимся рассмотрением двух
может служить обобщенная аксиома "семантической неэквивалент- примеров, не требующих введения громоздкого формального аппарата.
ности" стимулов или поведения в разных культурах или среди
представителей различных субкультурных групп [183 ]. Однако, как Первый из этих примеров связан с нелинейностью отношения между
бы ни формулировались такие соображения, они не лишены основа- теоретически определяемой переменной и индикатором. Рассмотрим
ний и требуют некоторой общей стратегии в решении проблем пример приборного измерения, приводимый в работе [30 ]
сопоставимости.
Если в "соседней" психологии вопросы сравнимости измерений
стали систематически разрабатываться еще в 40-е - 50-е годы (в
дифференциальной психологии, теории тестов, экспериментальной
110 11
1
и обсуждаемый авторами в том же, по сути, контексте роли содер- так как ошибки спецификации переменных будут распространяться
жательных теоретических соображений в непрямом социологическом по всей каузальной системе J89. Р.87-88 ]. По его мнению, особенно
измерении. Пусть теоретическая переменная - это уровень удовлет- типичны нелинейные отношения между социально-демографически-
воренности трудом для некоторой совокупности, зависящая (при ми, и вообще биографическими переменными, и переменными "внут-
контроле многочисленных прочих факторов) от каждого приращения ренних состояний" (например.между формальной длительностью об-
зарплаты (измеряемого, например, в рублях). Эта зависимость, как разования, измеренной как число лет обучения, и квалификацией).
и связь "морального" и "физического" богатства у Я.Бернулли (см.: Второй пример относится к проблемам сравнимости, возникаю-
[99]), вероятно, будет подвержена насыщению, так что функцио- щим из-за различий в сложности ситуаций, а именно - к последст-
нальная форма отношения между удовлетворенностью и доходом виям дифференциальной сложности в случае использования эффект-
будет выглядеть как на рис. 11. индикаторов для косвенного измерения в ситуации мультикаузаль-
Допустим, что в теоретической модели исследования предполага- ности.
ется наличие связи между удовлетворенностью трудом (или, уже, При использовании эффект-индикаторов, часто принимается до-
материальным вознаграждением за труд), т.е. внутренним состояни- пущение, что, кроме небольших случайных возмущений, единствен-
ем, и каким-то поведением P. Последнее может относиться к каче- ной причиной эффект-индикатора является неизмеряемая перемен-
ству труда, досуговой активности или чему-либо еще. В отсутствие ная, представляющая в данном случае интерес для теоретической
удовлетворительного способа измерения субъективного состояния У модели. Однако индикатор (обозначим его как X. ) может подвер-
исследователь может обратиться к причинному индикатору - зар- гаться воздействию не только переменной X, которую предполагается
плате, т.е. прибегнуть к приборному измерению. Если поведение P измерить, но и других переменных, например V или P . Кроме того,
и удовлетворенность У связаны линейно, то, согласно модели насы- эти переменные V и P сами могут быть связаны с переменной X в
щения, связь между индикатором У и переменной P будет нели- некоторых ситуациях. Тогда обоснованность использования индика-
нейной (кривая, изображенная на рис.11, может в конкретном случае тора X. или совокупности индикаторов будет варьировать от ситуа-
оказаться логарифмической функцией, сегментом параболы или ции к ситуации. Уже в статье 1968 г. [82] Х.Блейлок использует
степенной функцией с положительным показателем, меньшим 1). иллюстративный пример с измерением расовой дискриминации,
Мысленный эксперимент, предложенный Х.Блейлоком и близкий к которому он неоднократно обращается и в более поздних
к экспериментальным схемам психофизики, заключается в следую- работах. Пусть, скажем, некоторая мера неравенства, типа различия
щем предположении. Пусть для условия Л (относящегося ко времени, в доходе, служит для измерения расовой дискриминации. В некото-
характеристикам популяции или к ситуации) основное число случаев рой ситуации А вполне обоснованным кажется предположение, что
единственной причиной неравенства X , помимо случайных возму-
попадет в левую часть кривой, а для аналогичного условия В - в щений, является дискриминация со стороны работодателя. Однако
правую, верхнюю часть. Тогда коэффициент уравнения, линейно предположим, что в более сложной ситуации В, помимо дискрими-
связывающего P и Yl , для условия А окажется " круче", больше, нации со стороны работодателя, может оказаться существенным
чем для условия В. Конечно, если мы имеем прямую меру для У и влияние различий в уровне образования, способностей или опыта
эксплицитную вспомогательную теорию измерения, предсказываю- работы (обозначим соответственно как F, P, и У). Если эти перемен-
щую данный эффект, это предположение легко проверяемо. Но если ные будут измерены, то существует возможность получения чистого
удовлетворенность У прямо не измеряется, то нельзя будет отличить эффекта X (см. рис.12). Однако ситуации А и В, в силу своей
предсказания модели, изображенной на рис. 11, от модели, где простоты, включают лишь очень ограниченное число факторов.
отношения У и У - линейны, а нелинейна связь между У Более сложная ситуация потребует разработки более сложной моде-
(удовлетворенностью) и P (поведением). В этом случае нужны ли. В некоторых случаях, если исследование охватывает достаточно
несколько показателей для У — У1 , У2 и т.д., а также явные большой промежуток времени, разумно предположить, что показа-
теоретические предсказания о форме связи каждого Уj с У. Этого тель различий в образовании зависит не только от "образовательной"
рода проблемы часто оказываются вне поля зрения исследователя, дискриминации как ограничения доступа к равным возможностям
использующего факторный анализ или путевой анализ и обучения, но и от поселенческой сегрегации. Если предположить,
некритически принимающего допущения о линейности что поселенческая сегрегация, "накопленная" к моменту t, влияет и
функциональных связей между "скрытыми" конструктами и на доступность тех или иных профессий (помимо прямой професси-
индикаторами без проверки пределов его применимости к ональной дискриминации), то можно ли сравнивать показатели
конкретной ситуации38 . Х.Блейлок особенно предостерегает от " неравенства в доходах (Х1 ) или в образовании в этой ситуации с
слепого" использования программ типа LISREL, 112 " теми же" показателями в более простых ситуациях А и В.
Важным преимуществом причинного анализа и построения диаг-
рамм здесь является возможность визуализировать модель измере-
38
Если такое допущение неприемлемо, то можно попытаться разбить выборку на подвы- 8 И.Ф.Девятко 113
борки, соответствующие областям значений Аи В на континууме У^, и провести грубую
оценку теоретической модели.
Профессиональная
дискриминация
ПР

Неизмеряемые
переменные
дискриминации

Измеряемые
показатели

Профессиональное
неравенство
ния и сделать очевидной границу, когда неизвестных становится
"слишком много" и получить единственное решение невозможно,
Различия в голо-
т.е. возникает необходимость в априорных предположениях (напри- совании на выборах
мер, различия в уровне образования зависят только от дискримина- *
ции в сфере образования). Последнее обстоятельство очень сущест- Рис. 13. Схема связи переменных дискриминации с измеряемыми показателями .
венно для повышения культуры не только измерения, но и теорети-
зирования: ведь в ситуации, когда отсутствуют ограничения на * В данной модели опущены многие переменные блока " Поведение меньшинства"
-агрессия, избегание контактов с доминирующим большинством и т.п.,
сложность теоретической модели и для каждого "случая" вводятся рассматриваемые Х.Блейлоком.
новые объясняющие факторы, всегда можно, образно говоря, "объ-
яснить 100% дисперсии". "Можно показать, что при допущении заимствовались социологами из психометрики. В тех ситуациях,
возможности, когда все влияет на все с неопределенными парамет- когда невозможно связать концепты и индикаторы по принципу
рами, будет существовать бесконечное число наборов оценок пара- "один к одному", но наличие нескольких показателей для каждой
метров, абсолютно согласованных с одним и тем же множеством ненаблюдаемой переменной делает измерение возможным, понятие
данных" [86. Р.282]39. При этом теоретики могут до бесконечности "валидности" может вводить в заблуждение, подталкивая исследо-
спорить, чей набор объясняющих переменных "лучше" без всяких вателя к поиску несуществующего "идеального" валидного показа-
шансов разрешить этот спор эмпирическими средствами. теля. Правильным путем здесь чаще всего будет разработка вспомо-
Анализ влияния дифференциальной сложности ситуаций и соот- гательной теории, связывающей несколько неизмеряемых перемен-
ветствующих им теоретических моделей на сравнимость показателей ных с несколькими индикаторами (о чем и шла речь в предыдущей
позволяет затронуть еще одну существенную проблему - пробле- главе). Вернувшись к примеру с дискриминацией, мы можем заме-
му валидности. Как мы показали во второй главе нашей книги, тить, что понятие дискриминирующего поведения довольно далеко
разработка моделей измерения привела к пониманию ограни- отстоит от обычно используемых мер дискриминации, относящихся
ченности, присущей концепции валидности и традиционным подхо- к физической сегрегации либо к какого-то рода неравенству. В самой
дам к валидизации, которые в конце 50-х - начале 60-х годов активно простой ситуации различия в социально-профессиональной структу-
ре доминирующего большинства и меньшинства могут быть исполь-
114
зованы как показатель профессиональной дискриминации, различия
в образовании - как показатель дискриминации в получении обра-
зования, а поселенческая сегрегация - как индикатор поселенческой
39
Интересно отметить, что анализируя с этой точки зрения недостатки изоляции40. Однако в более сложной и близкой к реальности
исторического метода в книге [90], Х.Блейлок приходит к выводу, что тактика ситу-
введения новых объясняющих переменных для каждого нового наблюдения
превращает социолога или политолога в "эрудированного обывателя", суждения 115
которого всегда согласованы со здравым смыслом (часто содержащим логически
несовместимые посылки) и в то же время богаты неизвестными" человеку-с-улицы"
деталями и специально подобранными подтверждающими примерами. 40
Хотя даже такое сравнительно простое понятие, как поселенческая сегрегация, создает
серьезные трудности при попытке измерения. См. [120].
ации любые меры неравенства являются результатом не только Глава четвертая
дискриминирующего поведения большинства, но и поведения самого НОВЫЕ ПРИЛОЖЕНИЯ И ПЕРСПЕКТИВЫ
меньшинства, что должно быть отражено во вспомогательной теории
измерения. МОДЕЛИРУЮЩЕГО ПОДХОДА
Кроме того, переменные-индикаторы могут быть функциями не
только тех переменных дискриминации, которые включены в основ-
ную теорию и являются основной целью измерения. Приведем одну 1. Обобщение моделей структурных уравнений с
из возможных моделей примера с дискриминацией, рассматривае- латентной переменной и "общеизвестные истины" измерения
мую Х.Блейлоком в статье [86. Р.296] (см. рис. 13).
Вполне очевидно, что традиционная концепция валидности в В недавней фундаментальной работе К.Боллена [96 ] представле-
ситуации, сходной с изображенной на рис. 13, имеет весьма ограни- ния о самостоятельном значении теоретически обоснованных моде-
ченное применение. Очевидны и последствия для сравнимости пока- лей измерения были использованы для успешной попытки синтеза и
зателей. Например, "экономическое неравенство" в ситуации, изо- обобщения подходов и методов, применяемых в психометрике, эко-
браженной на рис. 13, будет зависеть от всех неизмеряемых пере- нометрике и социальных науках при описании и анализе отношений
менных и, в свою очередь, влиять по крайней мере на поселенческую между теоретическими и эмпирическими переменными. К моделям
и социальную изоляцию. Следовательно, нет никаких оснований структурных уравнений (structural equation models, т.е.. моделям,
считать этот индикатор эквивалентным "экономическому неравен- состоящим из структурных уравнений) относятся и регрессионные,
ству" в ситуации взаимооднозначного соответствия. и эконометрические, и факторно-аналитические процедуры. Таким
образом, и модели со множественными индикаторами, и модели
путевого анализа, и факторные модели с латентными переменными
могут быть включены в общий класс структурных моделей с
латентными (или ненаблюдаемыми) переменными. Система
структурных уравнений, задающих модель, в этом общем случае
состоит из двух подсистем: модели латентных переменных,
описывающей отношения ненаблюдаемых (неизмеряемых)
одномерных конструктов, и модели измерения [96. Р. 11]. Таким
образом, предложенное обобщение понятия структурной модели в
явной, эксплицитной форме включает модель измерения в
проверяемую теоретическую модель. Полная теоретическая модель
описывает отношения между зависимыми и независимыми
переменными и допускает наличие ошибок измерения и в первых, и
во вторых.
Демонстрацией продуктивности этого подхода стал систематиче-
ский критический пересмотр ряда "общеизвестных истин" классиче-
ской теории тестов, результаты которого изложены, в частности, в
работе К.Боллена и Р.Леннокса [97 ]. Так как к теме эффективности
моделирующего подхода к измерению для пересмотра ряда некрити-
чески принимаемых положений традиционной психометрики мы уже
неоднократно обращались (например, при описании многоиндика-
торного подхода к конструктной валидности), мы ограничимся лишь
описанием некоторых новых результатов, полученных Болленом и
Ленноксом. Эти результаты интересны для нас, прежде всего, как
еще одна иллюстрация тех радикальных изменений, которые были
инициированы возникновением моделирующего подхода к измере-
нию. Боллен и Леннокс поставили своей целью проверить, насколько
обоснованны обычные рекомендации, касающиеся отбора индикато-
ров (чаще всего - тестов или анкетных вопросов) и используемые
исследователями в повседневной практике. Эту проверку они осуще-
ствили для двух общих моделей измерения. Первая из них - класси-
ческая модель теории тестов и факторного анализа, где индикаторы

117
(пункты теста, вопросы) зависят от латентной переменной. Эту торов с истинным баллом положительна, то и их корреляции друг с
модель, вслед за Х.Блейлоком, часто называют моделью измерения другом также должны быть положительны.
с эффект-индикаторами, т.е. индикаторами-следствиями латентной Совсем иной будет ситуация для второй модели с причинными
переменной. Для этой модели принимаются все обычные индикаторами латентной переменной, так как сама модель не нала-
предположения теории тестов, в том числе и предположение о гает никаких ограничений на попарные корреляции между индика-
том, что истинные значения латентной переменной определяют торами: они могут быть положительными, отрицательными или
значения ее индикаторов. Так как латентная переменная - это нулевыми. Скажем, связь между образованием и доходом как инди-
чаще всего некоторый теоретический конструкт, то примерами каторами статуса в некоторых обществах может быть нулевой или
этой общей модели могут служить и многочисленные "черты отрицательной. Столь же трудно определить заранее направление и
личности" (от тревожности до макиавеллизма), и способности величину связи между различными причинными индикаторами
(например, невербальный интеллект), и диспозиции (политическая стресса, например, потерей работы, смертью супруга и болезнью.
активность). Исследователь, использующий рутинные процедуры поиска макси-
Вторая рассматривавшаяся Болленом и Ленноксом общая модель мальных значений в матрице корреляций, рискует пропустить самые
- это модель с причинными индикаторами. Мы уже обращались к информативные индикаторы. Таким образом, некритичное исполь-
примерам причинных индикаторов латентных переменных. В каче- зование критерия внутренней согласованности может вести к совер-
стве причинных индикаторов используются, например, многие кате- шенно ошибочным выводам.
гориальные переменные, описывающие "жизненный путь" респон- Другим распространенным методологическим "рецептом" (не
дентов, например, образование или доход родителей (другие приме- всегда, кстати, согласующимся с критерием внутренней согласован-
ры можно найти на с.104-110 данной работы). Разумеется, причин- ности) является оптимальная корреляция индикаторов. Аргумен-
ными индикаторами они становятся лишь в том случае, если иссле- том в этом случае обычно является необходимость обеспечить гене-
дователь предполагает, что эти переменные детерминируют значе- рализуемость и валидность выводов, что невозможно для чрезмерно,
ние латентной переменной. Например, социолог может считать, что специфичного и узкого набора высококоррелированных индикаторов.
продолжительность обучения и доход определяют социальный статус Однако анализ двух вышеописанных элементарных моделей ста-
(не вкладывая при этом в понятия "определяют" или "служит вит под сомнение и эту рекомендацию. Для модели с эффект-инди-
причиной" буквального физического смысла). Другими примерами каторами латентной переменной предпочтительной все же является
могут служить "лишение пищи" как причинный индикатор "голода", высокая корреляция индикаторов. Если же у исследователя есть
"психологическая травма" как причинный индикатор "стресса" и основания предположить наличие скоррелированных ошибок изме-
т.п. Не входя в технические подробности (многие из которых, к тому рения между индикаторами, то он не имеет никаких оснований
же, обсуждались нами раньше), отметим, что даже простейшая предпочитать индикаторы с умеренной корреляцией, так как един-
модель латентной переменной с несколькими причинными индика- ственный способ справиться с этой проблемой - это специфицировать
торами (последние еще называют "формативными") будет очевид- предполагаемую модель измерения и внести следующие из нее
ным образом отличаться от предыдущей. Например, возрастание поправки в процедуру отбора индикаторов.
значения латентной переменной не обязательно будет сопряжено с В случае же модели с причинными индикаторами, как уже
возрастанием значений всех ее индикаторов. говорилось, величины корреляций между индикаторами никак не
Одним из фундаментальных понятий теории тестов является ограничиваются самой моделью и определяются лежащими вне
понятие внутренней согласованности пунктов теста или батареи модели (экзогенными) факторами. Конечно, высокие корреляции
вопросов, предназначенных для измерения одной латентной пере- между причинными индикаторами затрудняют оценку воздействия
менной. Это понятие составляет основу для оценки надежности- каждого из них на латентную переменную (проблема мультиколли-
согласованности, или одномоментной надежности (см., в частности, неарности), и в этой ситуации низкие корреляции предпочтительнее.
с.61-64 данной работы), и для применения факторного анализа. Однако никаких общих рекомендаций для причинных индикаторов
Внутренняя согласованность подразумевает положительную корре- сделать нельзя, так как оптимальное значение корреляций между
ляцию индикаторов одной переменной (разумеется, при условии, что индикаторами будет определяться лишь конкретной моделью изме-
все пункты-индикаторы сформулированы в одном направлении). рения.
Обычно рекомендуется исключать индикаторы, имеющие нулевую При выборе индикаторов одномерного теоретического конструкта
или отрицательную корреляцию с остальными. Обоснованность кри- часто рекомендуется выбирать индикаторы, представляющие все
терия внутренней согласованности для первой модели - с эффект- аспекты ("фасеты") этого конструкта, т.е. латентной переменной
индикаторами латентной переменной - не вызывает никаких сомне- (ср. с.37). Боллен и Леннокс, рассмотрев две описанные элементар-
ний. При условии стандартизации латентной и наблюдаемых пере- ные модели, пришли к следующему выводу: "В общем итоге, реко-
менных, корреляция между индикаторами будет равна произведе- мендация делать выборку индикаторов для всех граней конструкта
нию их корреляций с истинным баллом. Если корреляция индика-
118 11
9
может вводить в заблуждение. Для эффект-индикаторов 120
одномерного конструкта равно надежные индикаторы в сущности ющуюся следствием наблюдаемых показателей? - и со статистиче-
взаимозаменяемы. Если же многогранность означает ской точек зрения. В уже упомянутой фундаментальной работе
многомерность, то каждое измерение (dimension) должно Боллена [96 ] доказывается, что способом интерпретации и
рассматриваться отдельно, на основании своего собственного статистической идентификации модели измерения с причинными
множества эффект-индикаторов. В случае же причинных индикаторами является ее включение в более широкую
индикаторов, исключение какого-то индикатора меняет саму теоретическую модель, где присутствуют и эффекты самой
латентную переменную, ее состав (и интерпретацию), и, за латентной переменной.
несколькими исключениями, важно включить каждый причинный Мы можем лишь согласиться с выводом, к которому приходят
индикатор" [97. Р.308 ]. Таким образом, стремление к Боллен и Леннокс: использование самих по себе структурных
максимальной представленности всех аспектов одномерного моделей измерения еще не ведет к правильному выбору
конструкта обоснованно лишь при выборе причинных индикаторов индикаторов, однако формальная спецификация модели измерения
и не имеет никакого смысла в случае эффект-индикаторов. Другие - единственное средство понять, какие из общепринятых правил
интересные результаты, полученные Болленом и Ленноксом при измерения подходят в данном случае [97. Р.312].
анализе общих моделей измерения с латентной переменной, мы
лишь кратко суммируем, так как их изложение здесь потребовало 2. Г£ГЯАО-методология и процедуры автоматического поиска
бы привлечения достаточно специальных деталей. Первый из этих моделей
результатов относится к часто используемому правилу сравнения Успехи когнитивной науки и статистического моделирования,
внутриконструктной и межкон-структной корреляции подкрепленные достижениями компьютерной революции, сделали
индикаторов. Суть этого правила кажется интуитивно ясной: осязаемой перспективу создания нормативной теории научного от-
корреляция между индикаторами одной латентной переменной- крытия и алгоритмических процедур, обеспечивающих поиск объяс-
конструкта (например, между пунктами одного теста) должна нительных моделей для эмпирических данных, полученных неэкс-
быть выше, чем корреляция между индикаторами разных периментальным путем. Такая перспектива вновь оживила надежды
конструктов. В действительности, данное правило может вести к на построение строгого метода научного вывода для "нестрогих" и
ошибкам независимо от типа индикаторов. Этот вывод может быть неэкспериментальных наук. Книга К.Глаймура, Р.Шейниса,
получен приблизительно тем же способом, который был использован П.Спиртеса и К.Келли [135] стала первой попыткой создать ком-
при критике "М-М"-матриц Кэмпбелла-Фиске с позиций пьютерные процедуры научного открытия в социологии на основе
моделирующего подхода (см. с.82-86 данной работы). определенной методологии, которая воплотилась в нормативных
Другой распространенной практикой является использование критериях отбора и проверки причинных моделей, являющихся,
суммарного балла в качестве латентной переменной. Арифметиче- пожалуй, самым популярным типом "мини-теорий" в
ская сумма значений индикаторов (или линейный сводный показа- общественных науках. Разработанные авторами методы и
тель) часто подставляется в качестве латентной переменной в процедуры поиска причинного объяснения реализованы в
регрессионном, дисперсионном анализе и т.п. И в этом случае компьютерной программе TETRAD и имеют довольно долгую и
обоснованность такой практики зависит от того, какого типа инди- существенную для критической оценки Г/?Г7?АО-методологии
каторы используются и какова модель измерения. Так, при предысторию. С краткого описания последней мы и начнем
использовании суммарного балла в качестве независимой обсуждение возможностей и ограничений TETRAD-анализа.
переменной в регрессионной модели получаемые оценки С некоторой долей упрощения можно сказать, что вся история
коэффициентов могут оказываться смещенными [97. Р.309-310] использования прикладной статистики в неэкспериментальных
(см. также: [96. Ch.5]). Использование процедуры взвешивания науках сводится к попыткам заменить экспериментальный
может несколько улучшить ситуацию. контроль статистическим, т.е. сделать возможным обоснованный
Таким образом, уже только учет направления связи между причинный вывод, опирающийся на данные о частотных
латентным конструктом и индикатором в самых общих моделях распределениях, там, где по практическим или этическим
измерения позволяет критически отнестись ко многим правилам соображениям невозможен классический эксперимент с
отбора индикаторов и оценки шкал и тестов. варьированием независимой переменной, контролем
Разумеется, рассмотренные Болленом и Ленноксом модели иррелевантных факторов и измерением главного эффекта41. В
измерения существенно упрощены: ошибки измерения в них не основе идей регрессии и корреляции, выдвинутых Ф.Гальтоном и
скорре-лированы, а между латентными переменными и К.Пирсоном в XIX в., лежало стремление вы-
индикаторами существует взаимнооднозначное соответствие.
Кроме того, элементарная модель с причинными индикаторами
латентной переменной слишком проблематична и с содержательной 41
Вопрос о правомерности такой замены все еще остается открытым с
- как интерпретировать, не вводя дополнительных факторов, методологической тонки зрения. Достаточно полное представление о критических
латентную переменную, явля- аргументах, используемых в этой дискуссии, можно получить из работ [168; 241].
121
вести причину - генетическую наследственность - из ее статистиче- бы робастными или упругими при изменениях в спецификации
ских проявлений. У.Огберн, первым из социологов применивший значений свободных параметров" [135. Р.236]. Применительно к ,
частную корреляцию для анализа выборочных данных, также стре- однофакторной модели это означало, что следующие из нее тетрад-
мился выявить истинную причинную структуру, замаскированную ные разности должны быть нулевыми для генеральной совокупности
смешивающими факторами [122. Р. 134-135]. вне зависимости от того, каковы конкретные значения "нагрузок"
Методы, используемые в TETRAD, как и эвристические принци- отдельных тестов по латентному фактору. Аналогичные рассуждения
пы выбора наилучшей объяснительной модели, восходят к одной из верны и для любого числа измеряемых переменных в модели общего
наиболее ранних традиций в этой области, которая берет начало в фактора: если все корреляции между измеряемыми переменными
работах английского психометриста Чарльза Спирмена, предложив- действительно объясняются существованием общего латентного
шего концепцию общего фактора интеллекта. Стремясь показать, фактора, то все тетрадные уравнения должны выполняться незави-
что во всех тестах интеллекта наличествует общий причинный симо от значений линейных коэффициентов43. Как отмечают Глай-
компонент, объясняющий корреляцию между ними, он открыл чрез- мур и его коллеги, Спирмен интересовался тетрадами потому, что
вычайно интересное соотношение. Во всех случаях, когда четыре видел' в них подтверждение своей психологической теории, но его
измеряемые переменныех{, *2, х , хвосходят к общему фактору, их последователей (Дж.Гарнетта, Т.Келлм и К.Холзингера) привлекла
корреляции будут удовлетворять следующим уравнениям: в спирменовской идее возможность разработать процедуры и крите-
p12 p34  p13 p 24  0 (1.1.) рии нахождения наилучшей линейной причинной модели, объясня-
ющей данные. Дж.Гарнетт и Т.Келли смогли сформулировать про-
p12 p34  p14 p 23  0 (1.2) блему нахождения таких ограничивающих условий для генеральной
p13 p 24  p14 p 23  0 (1.3) ковариационной матрицы, которые были бы необходимы и достаточ-
(Здесь и далее в подстрочных индексах из соображений простоты ны, чтобы принять какую-то линейную причинную модель. При этом
модель будет предполагать их выполнение для всех значений линей-
оставлены лишь номера измеряемых переменных, т.е. вместо рxixj ных коэффициентов, не налагая никаких иных независимых огра-
стоит рij... ) ничений. В такой постановке эта проблема непосредственно связана
Спирмену удалось показать, что предположение о наличии общего с эвристическими поисковыми процедурами, используемыми в про-
фактора вполне объясняет, почему эти ограничивающие условия, грамме TETRAD. Уже к началу 30-х годов проблема была решена
наложенные на значения корреляций, будут удовлетворяться в для целого ряда важных частных случаев, однако вычислительные
генеральной совокупности, однако, увлеченный идеей "единой ин- сложности при использовании моделей с большим числом измеряе-
теллектуальной способности", детерминирующей все интеллекту- мых переменных препятствовали более быстрому прогрессу. Прекра-
альные проявления человека, он не заметил, что эти ограничения щение работы в этом направлении, на четверть века отсрочившее
-тетрадные уравнения, или тетрадные разности (от греч. гетрах появление эвристических процедур "компьютерного открытия" и
-четыре) - будут выполняться и в некоторых других случаях, при- причинного анализа моделей измерения, было связано с блестящими
менительно к другим причинным моделям измерения (например, успехами в области факторного анализа.
модели с двумя скоррелированными факторами42. Иначе говоря, Выход терстоуновских "Векторов ума" (1935), содержавших эф-
Спирмен ошибался, полагая, что верен и обратный вывод: из выпол- фективный и простой в вычислительном отношении алгоритм редук-
нения тетрадных уравнений следует, что верна однофакторная мо- ции данных, радикально изменил взгляды и интересы абсолютного
дель. Правда, столь незначительный "промах" нисколько не снижает большинства ученых, занимавшихся психометрикой и математической
значения того важнейшего и недооцененного вклада, который Спир- социологией, а также ведущие способы их исследовательской
мен внес в понимание природы объяснения в неэкспериментальной практики. Сейчас, когда критика бездумного использования
науке. Глаймур и соавторы формулируют суть этого вклада следую- эксплораторного факторного анализа в качестве волшебной машинки
щим образом:"Ведущая методологическая идея Спирмена, ни разу для обнаружения новых "латентных сущностей" становится общим
не сформулированная им вполне отчетливо, видимо, заключалась в местом, трудно по достоинству оценить воздействие взглядов
том, что наилучшим является такое объяснение, которое порождает Л.Терстоуна на современников. Между тем этот гигант сделал для
ограничения, обнаруживаемые в мерах генеральной совокупно- развития психометрики и психологии XX в. не меньше, чем его
сти, не предполагая при этом определенных значений параметров. учитель Т.Эдисон для развития техники. Как мы уже отмечали выше,
Другими словами, он предпочитал те объяснения, которые являлись он придерживался определенной философии науки, согласно
122 которой основной целью науки является нахождение конструктов,
максимально просто и экономно описывающих данные
наблюдений.
123

42
Напомним, что мы уже говорили об использовании тетрадических (или тетрадных)
разностей в методе множественных индикаторов (см. с.88-89).
43
Для n-переменных число возможных тетрадных уравнений составит 3 • C n4 .
американский ученый Герберт А.Саймон. Величина его вклада в
Именно эта концепция стала методологической основой факторного развитие методов "компьютерного открытия" в социологии вполне
анализа44, и в этом смысле Терстоун действительно изобрел "почти соответствует многообразию его исследовательских интересов - ис-
магическую процедуру, с помощью которой можно было делать кусственный интеллект, методология науки, причинное моделирова-
науку, открывать теории и двигать прогресс" [135. Р.242]. Спирме- ние, экономика, когнитивная психология, прикладная статистика
новские тетрады Терстоун рассматривал как частный случай, не -и в значительной мере обусловлена этим многообразием . Прежде
представляющий особого интереса: "Спирмен, посредственный мате- всего Саймон одним из первых применил структурные уравнения,
матик, грубый и агрессивный спорщик, человек, привязанный к использовавшиеся в эконометрике, для причинной интерпретации
одной теории и лишенный автоматического метода совершения социологических моделей. Он поставил проблему вывода каузальных
открытий, имел мало шансов в сравнении с Терстоуном" [135. утверждений из статистических данных о корреляциях на основе
Р.242]. отношений идентифицируемости переменных, возродив идеи
Эффективность факторного анализа тесно связана с жесткостью Спирмена. Помимо этого, Саймон, начиная со второй половины
постулируемой им причинной модели измерения. В отличие от ана- 50-х годов, активно участвовал в самых значительных
лиза вытекающих из гипотетической модели ограничений на корре- исследовательских программах по моделированию
ляционную матрицу, который практиковали Спирмен и его последо- интеллектуальной деятельности человека. Одна из первых работ в
ватели, факторный анализ "отбрасывает" возможность прямого при- этой области - созданная А.Ньюэллом, Дж.Шоу и Саймоном
чинного влияния измеряемых переменных друг на друга либо латен- программа "машина Логик-теоретик", -приобрела очень широкую
тную переменную. Более того, психометрические представления той известность, так как смогла воспроизвести большую честь
эпохи (разделявшиеся, впрочем, и Спирменом) исключали возмож- результатов из "PrinciPia mathematica" Б.Рассела и А.Уайтхеда. В
ность причинного влияния латентных черт друг на друга, которая 1987 г. Саймон, совместно с П.Лэнгли, Г.Брэдшоу и Дж.Житкоу,
теоретически допускалась формальной моделью факторного ана - опубликовал весьма впечатляющие результаты многолетней работы
по моделированию процессов научного открытия средствами
лиза. Глаймур и соавторы вполне обоснованно, на наш взгляд, свя- искусственного интеллекта [159]. Системы искусственного
зывают этот факт с верой в генетическую предопределенность спо- интеллекта и программы для ЭВМ (семейство программ BACON,
собностей и личностных черт и укоренившейся со времен Гальтона GLOUBER и др.) не только способны находить количественные
и Пирсона ориентацией на биологические редукционистские мо- законы, описывающие "поведение" физических или химических
дели. переменных, но и позволяют вводить новые теоретические концепты,
Таким образом, впервые высказанная Спирменом идея оценивать фиксирующие качественную сторону процессов. Однако влияние
объяснительный потенциал линейных причинных моделей, исходя из этих разработок на создание программы TETRAD едва ли можно
их способности накладывать структурные ограничения на ковариа- считать непосредственным, так как последняя основана на иных
ционную матрицу (вне зависимости от значений линейных коэффи- эвристических принципах. Куда более существенно влияние методо-
циентов в этих моделях), была надолго забыта. Глаймур, крупный логических взглядов Саймона и его философии науки, близкой к
специалист в области истории и философии науки, ссылаясь на свои идеям логического позитивизма, но лишенной таких его недостатков,
более ранние работы 45, и в особенности на анализируемые примеры как крайний эмпиризм и феноменализм. Наиболее полное философ-
из истории естественных наук [134], приравнивает открытие ское обоснование вычислительного подхода к нормативной теории
Спирменом структурной взаимосвязи между статистическими научного открытия дано Саймоном в книге "Модели открытия"
моделями и причинными процессами, порождающими наблюдаемые (1977). Здесь он остро критикует К.Поппера, отстаивавшего интуи-
значения, к коперниканскому перевороту в методологии социальных тивистскую трактовку научного творчества и полагавшего, вслед за
наук. Терстоун же, для которого способом выполнения ограничений большинством философов науки, что попытки сконструировать нор-
на выборочную матрицу ковариаций было нахождение линейных мативную теорию научного открытия, сопоставимую с нормативной
коэффициентов (т.е. факторных нагрузок), оказывается "Птолемеем теорией процессов проверки научных гипотез, абсолютно бес-
статистического моделирования", провозгласившим главным смысленны, так как реконструировать процессы вдохновения и
критерием оценки научной модели возможность упрощенного озарения - задача психологии, а не логики науки 46
описания данных [135.Р.242]. 125
Следующий ключевой персонаж в истории разработки компью-
терных процедур, обеспечивающих поиск линейных причинных
моделей объяснения для неэкспериментальных данных, - известный 46
В "Логике научного открытия", противореча заявленному в названии содержанию
собственной работы, Поппер писал: "... не существует ни логического метода
124 получения новых идей, ни логической реконструкции этого процесса.... каждое
открытие содержит "иррациональный элемент" или "творческую интуицию" в
бергсоновском смысле" [40. С.52]. Более поздние взгляды Поппера, изложенные в "
44
Детальную методологическую характеристику общей модели с латентными переменными и Объективном знании", в определенном смысле уже содержат некоторую нормативную
ее аксиом можно найти в работе [11. С.54-64]. теорию открытия, однако его эволюционная эпистемология сводит процесс научного
45
К историко-научным представлениям К.Глаймура, как и к его концепции эмпирического поиска к случайному перебору по принципу " проб и (исключения) ошибок".
подтверждения теорий, мы еще обратимся в следующем разделе.
Аргументы Саймона весьма убедительны, если, конечно, принять его причинных моделей с двумя скоррелированными неизмеряемыми
определение науки и научного открытия. Под логикой науки здесь переменными и четырьмя или шестью индикаторами (напомним, что
понимается совокупность нормативных стандартов для сравнительной в статье, опубликованной в том же номере журнала, Блейлок
оценки процессов (действий), используемых в ходе открытия или про- доказал, что эти критерии пригодны для любых рекурсивных моде -
верки теорий. Эта совокупность может рассматриваться как логика, лей с несколькими индикаторами латентных переменных). Идеи,
поскольку сами нормы выводимы из целей научной деятельности, Такая лежащие в основе эмпирического контроля причинной модели изме-
расширительная трактовка позволяет проводить логический анализ рения, который осуществляется посредством анализа вытекающих
любого целенаправленного поведения (в том числе процессов решения из модели структурных ограничений на корреляции (ковариации)
задач), которое всегда может быть описано и, следовательно - по наблюдаемых переменных, и составили фундамент многоиндикатор-
крайней мере потенциально, - допускает формализацию в виде ного подхода к оценке качества измерения (см. главу II данной
машинной программы. Если познавательные процессы могут быть книги). Еще одним важным шагом в расширении возможностей
представлены в качестве процессов вычислений, организованных как причинного анализа в социологии стало распространение методов
системы продукции 47, то нормативная теория (логика) научного от- путевого анализа на нерекурсивные модели с петлями обратной связи
крытия может быть формализована как совокупность критериев оценки, между переменными.
используемых человеком в процессе обнаружения законов [216. Р.328- Компьютерная революция, ощутимо затронувшая социологию в
332 ]. Такие "логики" не гарантируют, что открытие состоится, они конце 60-х - начале 70-х годов, упростила решение рутинных
носят эвристический характер, т.е. позволяют с высокой степенью вычислительных проблем статистического моделирования. С появ-
вероятности получить решение задачи или несколько решений, среди лением программ типа LISREL и EQS наметилась тенденция исполь-
которых находится верное. С точки зрения Саймона, разделяемое зовать ЭВМ не только для вычислений при оценке параметров или
многими философами предубеждение против попыток построить нор- проверке гипотез, но и для активного поиска возможных модифика -
мативную теорию открытия основано на уверенности, что любая ло - ций предварительно заданной модели. Однако эти программы осу-
гика открытия столкнется с проблемой индукции. Однако проблема ществляли лишь узкий, направленный поиск альтернативных при-
индуктивного вывода и предсказания в действительности лежит не в чинных моделей и, кроме того, были основаны на "неспирменовской"
области теории научного открытия, а в области теории проверки и стратегии пересмотра исходной модели.
подтверждения: "Отделив выявление закономерностей от предсказания, TETRAD - первая попытка синтезировать спирменовский метод
мы можем создать истинную нормативную теорию научного открытия - поиска наилучшего причинного объяснения для
логику открытия" [216. Р.335]. неэкспериментальных данных, неопозитивистские представления
Как уже говорилось, в социологии причинный анализ статисти- Саймона о нормативной теории научного открытия, моделирующий
ческих данных приобрел популярность в 1960-е годы, прежде всего подход к социологическому измерению и самые современные
благодаря работам Х.Блейлока. В книге "Причинный вывод в неэк- разработки в области искусственного интеллекта.
спериментальных исследованиях" (1961) он продемонстрировал воз- Проблема, стоявшая перед создателями программы TETRAD,
можности статистического моделирования и причинного анализа в заключалась в том, чтобы найти общий алгоритм для быстрого
проверке сложных социологических гипотез, опираясь, в частности, вычисления тетрадных уравнений (либо других ограничений,
на некоторые идеи Саймона. Блейлок фактически заново изобрел робастно предполагаемых любой линейной причинной моделью) и
процедуру анализа ограничений, накладываемых линейной моделью сравнения этих ограничений с теми, которые приблизительно
на ковариационную матрицу. Модели, рассматривавшиеся им в удовлетворяются в выборочной ковариационной матрице, т.е. в
первых работах, обычно отличались от моделей, изучавшихся в данных. Такой алгоритм, будучи реализованным в компьютерной
психометрике и эконометрике. Они не содержали общего фактора, программе, позволил бы социологу вести эвристический поиск среди
поэтому ограничения накладывались на частные корреляции (этот сколь угодно большого числа линейных причинных моделей, не
тип моделей соответствует типу причинной связи с промежуточной ограничиваясь сравнением объяснительного потенциала двух или
переменной). Полное "возрождение" спирменовских идей в социоло- трех моделей, оказавшихся в поле его зрения. Удалось ли решить
гии произошло в конце 60-х годов, после публикации статьи Г.Кос- эту задачу?
тнера [113]. В главе II данной работы было показано, как, руковод- Программа TETRAD - это "интеллектуальный партнер" исследо-
ствуясь предложенным Блейлоком причинным подходом к анализу вателя в построении модельных структур, описывающих поведение
ошибки измерения, Костнер показал, что тетрадные уравнения могут переменных, в проверке правильности спецификации модели и, в
использоваться в качестве критерия согласованности для простейших сущности, в обосновании причинного вывода в эмпирическом социо-
логическом исследовании. Программа может быть использована
126 лишь для определенных типов линейных причинных моделей, однако
это подмножество моделей репрезентирует весьма типичные для
социологии структурные гипотезы. TETRAD на основании выбороч-
47
Система продукций - набор связок типа " цель (условие) - действие", т.е. в данном слу-
127
чае - условных пропозиций типа " Если процесс X должен быть эффективен для дости-
жения цели Y, то он должен обладать свойствами типа А, В, С" [216. Р.228].
ных данных и задаваемой исследователем базовой (скелетной) мо-
дели позволяет получить такие ее модификации, которые наилуч- При работе с программой TETRAD необходимо ввести выбороч-
шим образом соответствуют данным с точки зрения определенных ную корреляционную (ковариационную) матрицу и исходную "ске-
принципов. Последние и являются критериями оценки линейных летную" модель 50, а также задать уровень значимости .чтобы прове-
моделей, т.е., по Саймону, составляют некоторую частную норма- рить, выполняются ли ограничения в выборочных данных. TETRAD
тивную теорию открытия. К принципам, по которым производится предлагает множество переработок исходной модели и таблицу, из
отбор наилучшей модели (или наилучшего дополнения исходной которой видно, как каждое предлагаемое дополнение влияет на
модели), относятся принцип Спирмена, принцип Терстоуна и игра- соблюдение принципов Спирмена и Терстоуна. Исследователь может
ющий вспомогательную роль принцип простоты. Первый подразу- выбрать оптимальное с точки зрения этих принципов дополнение и
мевает, что предпочтительной при прочих равных является та снова запустить программу для дополненной модели. Таким образом,
модель, которая влечет имеющие место в генеральной совокупности дерево поиска решения в TETRAD начинается с самой простой
ограничения для всех значений своих свободных параметров. Согласно причинной модели, а все более сложные "дочерние" модели прове-
второму, из модели не должны следовать ограничения, не выпол- ряются на каждом последующем этапе. Первичные показатели,
няющиеся в выборочных данных 48. Интуитивно ясный третий прин- определяемые TETRAD, включают: 1) число ограничений, предпо-
цип довольно трудно поддается формализации. Авторы TETRAD лагаемых исходной моделью (I), 2) число ограничений, предполага-
интерпретируют его следующим образом: более простой является емых выборочными данными на данном уровне значимости (Н),
причинная модель, содержащая меньшее число связей [135. Р.94- 3) число ограничений, следующих из модели, но не выполняющихся в
95 ]. Применение упомянутых принципов ведет к разным альтерна- выборочных данных (I — Н), 4) соответствующее число ограничений,
тивам. Принцип Спирмена определяет выбор более простых моделей, имеющих место для выборочных данных, но не предполагаемых
из которых следует большее число ограничений. Добавление же моделью (Н — I). При сравнении исходной модели с дополненными
ребра или скоррелированной ошибки в ориентированный граф, пред- основной мерой соблюдения принципа Спирмена является увеличение
ставляющий причинную модель 49, уменьшает число таких ограниче- числа уравнений, которые выполняются в данных, но не следуют из
ний и, стало быть, увеличивает вероятность ситуации, когда огра- модели. Лучшей считается модель с наименьшим значением этой
ничения, выполняющиеся в данных, не "схвачены" объяснительной величины / (Н — /). Для того, чтобы определить, насколько каждая
моделью. Принцип Терстоуна диктует выбор более сложных моде- из переработок исходной модели способствует соблюдению принципа
лей, поскольку увеличение числа связей в модели (т.е. добавление Терстоуна, используются два показателя - уменьшение числа пред-
ориентированных ребер или скоррелированных ошибок) опять-таки полагаемых моделью ограничений, не выполняющихся в данных
уменьшает число подразумеваемых моделью ограничений и делает D (/ — Я), и уменьшение "остатков" тетрадных разностей в выборке
маловероятной ситуацию избыточной "строгости" модели в отноше- (TTR), Программа содержит также грубую меру для оценки соот-
нии структуры данных. ветствия модели (индекс Бентлера-Бонетта), используемую для
Так как любые ограничивающие условия точно выполняются в принятия решения о прекращении поиска, если при дальнейших
конечной выборке лишь в редких случаях, минимизация числа модификациях модели соответствие не улучшается.
ограничений, предполагаемых моделью, будет способствовать соблю- Число ограничений, которые в принципе могут следовать из
дению принципа Терстоуна. Что касается принципа простоты, то это линейных причинных моделей, очень велико. В программе TETRAD
своеобразное средство "оккамизации" объяснительной модели. В анализируются лишь два типа таких ограничений: уже упоминавшиеся
отсутствие каких-либо безусловных преимуществ из нескольких тетрадные разности и стремящиеся к нулю частные корреляции.
моделей будет выбрана та, которая содержит наименьшее количество Коэффициент частной корреляции будет равен нулю в случае, когда
путей причинного влияния. Модифицируя модель, пользователь его делитель равен нулю, откуда следует ограничение Pij = PikPjk
получает информацию о том, как этот процесс влияет на соблюдение Причинная структура, соответствующая этому ограничению,
принципов Спирмена и Терстоуна. При этом он решает, какой "вес" достаточно очевидна: между X i и X j . нет никакого пути причинного
следует приписать каждому из этих принципов. влияния, помимо включающего X k . Что же касается тетрадных
разностей, то, как уже говорилось, типичными моделями, для которых
128 выполняются такие ограничения, являются модели, где измеряемые
переменные восходят к общему фактору, либо нескольким
скоррелированным факторам, либо образуют причинную "цепочку"
(такие модели обычно подразумевают ограничения на частные
корреляции). Важная особенность рассмотренных ограничений
48
Этот принцип носит имя Л.Терстоуна в связи с тем, что имеет фундаментальное значе-
ние для факторного анализа, где расхождение между вычисленными и наблюдаемыми 9 И.Ф.Девятко 129
корелляциями уменьшаются посредством введения дополнительной причинной
структуры.При этом соблюдается правило, по которому нужно избегать введения
ограничений, не имеющих места в данных.
49
Представление модели в форме графа - важное средство спецификации, позволяющее
явно задать ее логический каркас. " Граф в наиболее обнаженной форме выявляет по-
стулируемую систему отношений между переменными..." [25. С.78].
50
Если исходная модель не специфицирована, то TETRAD использует модель, в которой все
измеряемые переменные восходят к одному латентному фактору.
можно рассматривать как симптом существования эффекта "закреп-
заключается в том, что они могут быть выведены ления" (anchoring effect) между ответами на вопросы интервью [135.
непосредственно из ориентированного графа, представляющего Р.165].
элементарную причинную структуру статистической модели. Эффект "закрепления" (или "установки на якорь") известен в
Так как программа TETRAD реализует некоторую эвристику экспериментальной психологии и описывает механизм возникнове-
для поиска наилучшей причинной модели, а не строгую ния ситуации, когда результаты одного психического процесса (оцен-
алгоритмическую процедуру, эффективность которой может быть ки величины стимула, решения задачи и т.п.) используются как
обоснована априорно, то оценка полезности этой программы исходная точка, база для другого процесса. Содержательная интер-
существенно зависит от познавательной ценности и претация эффекта может основываться на понятиях "уровня адап-
нетривиальности результатов. Авторы TETRAD подвергли тации", "стимульного контекста" или "сохранения когнитивного
вторичному анализу результаты ряда хорошо известных баланса". Последнее объяснение весьма убедительно, когда речь идет
социологических исследований и убедительно о порядке вопросов АС-шкалы. Их смысловая связанность и общая
продемонстрировали необходимость учитывать альтернативные нацеленность обеспечены специальными процедурами (см. выше) и,
объяснительные гипотезы и сомнительность некоторых вероятно, очевидны не только для исследователя, но и для респон-
некритически принимаемых допущений. дента. Стремясь к тому, чтобы его ответы были согласованы и
Проиллюстрируем возможности TETRAD как "орудия критики", последовательны, респондент будет учитывать свои предыдущие
обратившись к проведенному Глаймуром, Шейнисом, Спиртесом ответы, используя их как исходную точку. Результаты применения
и Келли анализу данных, полученных М.Коном в известном TETRAD подтвердили преимущества модели измерения, предусмат-
исследовании авторитарности - конформности различных ривающей прямые причинные влияния между вопросами АС-шкалы,
социальных групп американского общества [158 ]. Изучая т.е. гипотезу о том, что корреляции между ответами, не связанные
отношения между социальной принадлежностью, установками и с их зависимостью от латентного фактора "Авторитарного консерва-
чертами личности, Кон, в частности, рассматривал отношение тизма", объясняются причинными отношениями между самими воп-
латентной черты - фактора "Авторитарный консерватизм" - к росами-индикаторами (а не необъясненными корреляциями их оши-
переменным социальной стратификации. Измеряемыми бок измерения). На рис.14 представлены исходная модель измерения
переменными для определения показателя "Авторитарного "Авторитарного консерватизма", пересмотренная модель Дж.Миллера
консерватизма" были вопросы, имевшие пять вариантов ответа (от с коррелированными ошибками и одна из двух переработок
"совершенно согласен" до "совершенно несогласен"). исходной модели, предложенных TETRAD51. Анализ модели измере-
Использовались вопросы, разработанные Т.Адорно и его кол- ния для пяти вопросов АС-шкалы проводился до того, как стала
легами для классической "Авторитарной личности", которые известна их временная последовательность в интервью, т.е. вопросы
прошли процедуру селекции, гарантировавшую, по замыслу нумеровались условно. Поскольку две модели, найденные TETRAD,
автора, одномерность каждой шкалы относительно измеряемого ограничивали порядок четырех вопросов из пяти (между которыми
конструкта (критерием одномерности было соответствие модели вводились прямые причинные связи), то программа фактически
гутмановской шкалы). Кроме того, весь блок вопросов был "выдала" определенные утверждения о реальной последовательности
подвергнут факторному анализу, результаты которого вопросов. Одно из них, как выяснилось позднее, действительно
подтвердили специфичность отдельных шкал (в том числе, шкалы соответствовало тому порядку, в котором они задавались в исследо-
авторитарности) относительно различных гипотетических вании Кона. Статистическая проверка предложенных TETRAD мо-
конструктов [158. Р.265-269 ]. Таким образом, Кон выделил в делей с помощью программы EQS также подтвердила высокую
своем исследовании фактор "Авторитарного консерватизма" степень их соответствия данным. Этот анализ, наряду с другими
(АС), по отношению к которому отдельные вопросы служили вторичными исследованиями, проведенными разработчиками
индикаторами. В более поздних сравнительных обследованиях TETRAD, позволяет очертить пределы, в которых практическую
показано, что существуют "ядерные" пункты АС-шкалы, яв- применимость программы можно считать в достаточной мере дока-
ляющиеся индикаторами авторитарности для разных занной.
национальных групп. Моделью измерения всякий раз служила 131
модель латентного фактора. Традиционная для социальной
психологии интерпретация этой модели измерения предполагает,
что после выделения общего фактора, объясняющего связь между
пунктами шкалы, остаточные корреляции пунктов
приписываются коррелированным ошибкам, возникающим при
ответе. Именно так были проинтерпретированы результаты
использования пяти "ядерных" пунктов .АС-шкалы в работе
Дж.Миллера и соавторов [179]. Глаймур и его коллеги
воспользовались данными о корреляциях этих пяти вопросов, 51
чтобы проверить, нельзя ли скоррелировать модель и найти иное Здесь снова кружком обозначены неизмеряемые переменные, квадратом - измеряемые
объяснение остаточным корреляциям. Они предположили, что переменные-индикаторы. Пять вопросов АС-шкалы (1 - 5): 1) "Важнее всего научить
"остатки" детей абсолютному послушанию родителям"; 2) "В нашем сложном мире единственный
способ поступать правильно заключается в том, чтобы полагаться на руководителей и
130 специалистов"; 3) "Ни один порядочный человек не может уважать женщину, имевшую
сексуальные отношения до брака"; 4) "Любой хороший руководитель должен быт* строг
с подчиненными ему людьми, чтобы завоевать их уважение"; 5) " Неправильно
поступать иначе, чем поступали наши предки".
всех возможных альтернативных базовых моделей зависит от добро-
совестности и внимательности использующего ее исследователя. Если
базовая модель с самого начала не соответствует принципу Спирмена (не
содержит ограничений, имеющих место в данных), т она не может помочь
в выборе другой модели, поскольку использ., емые в TETRAD
ограничения не могут возникнуть в боле^ сложной дополненной
модели, если они не содержались в исходной простой.
Выбор между различными дополнениями исходной модели в TETRAD
основан на оценивании выполнения ограничений для выборочных данных
о корреляциях. Как справедливо отмечает С.Хант, обоснованность такого
выбора "будет решающим образом зависеть от способности TETRAD
правильно оценивать тетрадные разности и частные корреляции" и,
следовательно, от таких факторов, как размер выборки, форма
распределения выборочных данных и выбор уровня значимости [152.
Р.172]. Последнее обстоятельство особенно существенно, так как выбор
1) TETRAD полезна в поисках правдоподобных и успешно уровня значимости для принятия или отвержения гипотезы о выполнении
проходящих статистическую проверку моделей, значительно ограничений в выборочных данных не обеспечен в программе сколько-
расширяя возможности исследователя в рассмотрении множества нибудь строгими правилами. Выбирая обычный уровень значимости (0,05),
альтернативных объяснений. При этом, работая в режиме диалога, исследователь рискует столкнуться с ситуацией, когда будут тривиально
выполняться много ограничений и любые дальнейшие переработки модели
исследователь может эффективно использовать в поиске уже
окажутся излишними. Авторы рекомендуют выбирать большие значения
имеющиеся знания, содержательные соображения, чтобы исключить
(например 0,5), однако они не дают строгого метода для определения
противоречащие им гипотезы.
уровня значимости. Наконец, использование программы может вызвать те
2) TETRAD может быть полезна и в поиске альтернативной
исходной модели, в частности при принятии решения о же вычислительные проблемы, которые ранее возникали при
необходимости введения в модель латентных переменных (хотя, многоиндикаторном подходе к оценке качества измерения, где тетрадные
разумеется, TETRAD не может подсказать социологу, какой разности также использовались для проверки правильности модели
концепт соответствует этой латентной переменной). измерения. Для социологии весьма типичны маленькие корреляции между
3) Для данной исходной модели TETRAD может быть переменными, произведения которых столь малы, что тетрадные разности
использована с целью различения коррелированных ошибок и будут очень близки к нулю, даже если это не так для генеральной
прямых причинных связей между переменными-индикаторами. При совокупности.
этом иногдаона может определить направление причинной связи TETRAD-aHcUiH.3 можно рассматривать как весьма успешную попытку
последних.
4) Пространство поиска TETRAD альтернативных моделей передать машине некоторые функции исследователя в процессе
многократно шире того, которое доступно при работе "вручную" идентификации причинной модели (посредством алгоритмизации
или даже с помощью программ типа LISREL [135. Р.147]. определенных эвристических стратегий решения этой задачи человеком).
Не оценивая пока принципы и "образ науки", лежащие в осно- Однако помимо уже упоминавшихся технических ограничений, присущих
вании TETRAD, обратимся к анализу наиболее очевидных этому типу анализа, существуют и фундаментальные проблемы
недостатков в их техническом воплощении. Прежде всего, обоснования используемых здесь нормативных принципов и общих
программа никак не использует многие виды ограничений, которые представлений о возможностях и способах научного объяснения в
и теоретически, и практически могут быть вычислены.
Существенна и ориентированность программы на определенные социологии. Если даже считать бесспорной ту умеренную и осторожную
типы моделей, что делает ее неприменимой в целом ряде случаев. трактовку возможностей искусственного интеллекта и статистического
Далее. Так как программа основана на постепенном усложнении моделирования, которую дают авторы TETRAD [135. Р.15-61 ], весьма
базовой модели, она, естественно, не содержит никаких средств для проблематичными остаются гносеологические и, менее явно,
автоматического перехода от одной простой базовой модели к онтологические допущения, лежащие в основании TETRAD-метоцологии.
другой, тщательное рассмотрение Главная цель TETRAD-анализа - поиск альтернативных объяснений через
вторичный (третичный и т.д.) анализ данных. В этом смысле TETRAD
132 продолжает традиции эксплораторной статистики,
133 Тер-
основания которой подвергались достаточно серьезной критике (см.: 134
[185]). Глаймур и соавторы готовы согласиться с тем, что объясне- стоуна, и поэтому строгое обоснование эффективности этого подхода
ние, найденное TETRAD, может быть объяснением "к случаю", а зависит от возможности обоснования нормативных критериев отбора и
теория, сконструированная через поисковый анализ уже имеющихся
данных, "будет сконструирована специально, чтобы объяснить эти проверки моделей.
данные" [135. Р.58]. Однако они полагают, что понятие конструи - Насколько вообще оправдан эпистемический приоритет, который
рования теории "под данные" может иметь по крайней мере два разработчики TETRAD приписывают линейным причинным моделям,
смысла. Первый, когда исследователь действительно конструирует, накладывающим структурные ограничения на данные? Видимо, можно
"подгоняя" и "прилаживая" теорию. Найденное таким образом согласиться с продуктивностью такого подхода, когда соблюдается
теоретическое объяснение действительно не может считаться под- условие "при прочих равных", т.е. когда в отсутствие иных
твержденным данными, для которых оно было сконструировано. И содержательных, концептуально-теоретических обоснований для выбора
второй, когда сами теории- можно рассматривать как некоторые предпочтение отдается "моделям, которые не предполагают ошибочных
идеальные объекты, находящиеся "там", т.е. в попперовском третьем ограничений, но действительно предлагают эмпирически верные
мире объективного содержания мышления, и "имеющие такие логи- ограничения на данные" перед "моделями, которые не предполагают
ческие отношения с данными, которые они имеют, независимо от никаких ограничений (и, следовательно, никаких ошибочных
того, случилось ли кому-нибудь о них подумать" [135. Р.59 ]. В этом ограничений)" [135. Р. 190]. Этот подход явно сродни интуитивно
смысле открыть теорию не означает создать ее. Теория либо нахо - привлекательной идее предпочтительности максимально обязывающих (в
дится в правильных логических отношениях к данным (и подтверж- смысле возможных импликаций) и содержащих наименьшее число
дается ими), либо нет. И, значит, постоянная забота о разграничении параметров моделей, с использованием которых в определенной мере
поискового анализа и подтверждения теории оказывается надуман- связаны успехи естественных наук, что неоднократно подчеркивают и
ной, так как проверка теории основана отнюдь не на правильном авторы. Однако строго обосновать применимость этого принципа можно
предсказании и прогнозе. Реальная проблема в том, что, поскольку лишь основываясь на все тех же содержательных соображениях о
"специально сконструированные" теории также могут быть согласо- природе социальной реальности, "генерирующей" наши данные, т.е. на
ваны с данными, возникает необходимость найти такую концепцию некоторых уже онтологических допущениях, источником которых может
теоретического объяснения, которая требовала бы большего, чем быть только социологическая теория.
простое соответствие статистическим зависимостям, наблюдаемым в Именно это, вероятно, имеет в виду Г.Саймон, когда в предисловии к
данных. "Discovering Causal Structure" пишет: "... данные сами по себе не могут
В случае анализа линейных причинных моделей "большее" как помочь нам (прямо) выбрать правильные структурные уравнения! Мы
раз и заключается в наложении дополнительных ограничений на должны прибавить к данным дополнительную информацию ("наложить
структуру данных и проверке выполнения этих ограничений. Огра- дополнительные ограничения", как обычно говорят) , чтобы сделать
ничения, вводимые объяснительной моделью, проверяются относи - выбор. Они равнозначны эмпирическим предположениям о семантике
ситуации, о природе механизмов, в действительности породивших
тельно самой модели. Общая логика таких процедур носит название данные. Здесь не существует простой процедуры "поворота рукоятки",
бутстреп-методологии 52, которая послужила основой предложенной которая позволит нам делать автоматическую науку" [135. P.XIV].
Глаймуром оригинальной концепции проверки теорий [134 ]. Об этой Отметим, что существует еще одна возможность обоснования, которую,
концепции мы еще будем говорить дальше, здесь же ограничимся пожалуй, нельзя назвать строгой. Речь идет об этосе эмпирической
замечанием, что ее главная идея состоит в том, что гипотезы науки, иногда определяющем "законность" процедуры или
получают эмпирическое подтверждение не сами по себе, а лишь нормативного принципа не только через рациональность или
относительно вспомогательных предположений или утверждений практическую эффективность, но и через соответствие каким-то
основной теории. TETRAD-аиалт в сущности является бутстреп- одобряемым "культурным образцам" и нормативным "стандартам
процедурой поиска и проверки гипотез, т.е. гипотетических причин- поведения" (например, стандартам методической строгости, избегания
ных моделей. Однако глаймуровская логическая теория относитель- "спекулятивных" либо теоретически избыточных объяснений). Эта
ного подтверждения имеет внутренние ограничения, связанные с возможность хорошо известна "после-куновской" и
тем, что правдоподобие относительного подтверждения решающим "послемертоновской" социологии и истории науки. Не вдаваясь в
образом зависит от правдоподобия вспомогательных предположений, обсуждение этих известных соображений, заметим, что эмпирическая
используемых при проверке гипотезы. В TЕТRАD-анализе социология не только часто использовала возможность обоснования
эпистемически привилегированным статусом пользуются причинные своих принципов через стандарты "методической строгости" (в
модели, соответствующие описанным выше принципам Спирмена и отсутствие строгости теоретической), но и в значительной мере
осознавала неизбежные пределы такого обоснования. Не столько
52
Анализ современного употребления и этимологии понятия "бутстреп" дан в предисловии к русскому переводу книги
доказать, сколько проиллюстрировать эту мысль может
Б. Эфрона [61]. 135
небольшой и не слишком серьезный отрывок из воспоминаний 136
П.Лазарсфельда, приведенный Дж.Конверс в качестве эпиграфа к
одной из глав фундаментальной истории социологических исследо-
ваний в США [109. Р.267 ]: "Рождественский скетч в Бюро 53. Один из
парней играет меня. Я вхожу и распределяю сигары, и кто-то
спрашивает:"Это парень или девушка?". И этот фиктивный Лазар-
сфельд останавливается и говорит: "Черт возьми! Откуда я знаю,
меня интересует только метод".
3. Критика причинных моделей измерения с
латентной переменной
Мы уже обсуждали некоторые существенные ограничения, возни-
кающие при использовании множественных индикаторов для изме-
рения латентных переменных. Ограничения, присущие моделирую-
щему подходу, как было показано выше, осознаются большинством
исследователей и нередко успешно преодолеваются при решении
практических задач.
Однако некоторые критики причинных моделей с латентными
переменными отвергают саму возможность их использования. "То-
тальная" критика моделирующего подхода к измерению ставит под
сомнение использование информации о наблюдаемых переменных
для выводов о взаимоотношениях между социологическими показа-
телями и теоретическими конструктами. По мнению радикальных
критиков, этот подход в ообще не может быть обоснован на почве
содержательных или эпистемологических соображений.
Наиболее типична следующая аргументация. При определении
надежности индикаторов в латентных переменных в причинных
моделях измерения используются критерии согласованности,
выводимые из этих моделей. Критерии согласованности включают в
себя корреляции индикаторов и непосредственно измеряемых
теоретических переменных (примеры можно найти во второй главе
данной книги). В этом случае любые выводы о наличии или
отсутствии ошибки измерения в любом данном индикаторе
латентной переменной оказываются зависящими от наличия
ошибок измерения в гипотетически "правильных" индикаторах
других переменных и от правильности теоретической модели,
постулируемой исследователем. Иными словами, обоснованность
вывода о наличии или отсутствии ошибки измерения в отдельно
взятом индикаторе латентной теоретической переменной зависит от
правильности спецификации модели в целом, т.е. от прав-
доподобия всей совокупности допущений, касающихся остальных
латентных переменных и их индикаторов. Очевидно, однако, что
именно идея невозможности проверки отдельной гипотезы о
качестве "вот этого" индикатора составляет ядро концепции
взаимосвязи теории и измерения. Как мы неоднократно
подчеркивали, "теоретические" и "измерительные" гипотезы в
социальных науках могут быть раз-

53
Имеется в виду созданное П Лазарсфельдом и Р .Мертоном Бюро прикладных исследо-
ваний Колумбийского университета.
ведены лишь аналитически. Однако, как пишет представитель
"радикальной критики" Г.Г.Хоппе: "Ошибка измерения - рог
definitionem - это расхождение между наблюденным значением и
соответствующим истинным значением данной переменной. Само
определение логически предполагает, что наличие ошибки измере-
ния в некой переменной (Y) эпистемологически не зависит от
наличия или отсутствия ошибки измерения в любой другой перемен-
ной, определяемой независимо от Y, и, более того, что исход <данной
проверки> точно так же не зависит от существования или несуще-
ствования каких-либо взаимоотношений между этими переменны-
ми" [150. Р.505]. Таким образом, Хоппе представляется неприемле-
мой любая стратегия вывода, для которой проверка "измерительной"
гипотезы требует принятия некоторых вспомогательных допущений
о том, насколько хорошо измерены другие переменные и каков
характер эмпирических взаимоотношений между ними. С его точки
зрения, принятие любых вспомогательных гипотез для проверки
интересующей нас гипотезы о качестве измерения какой-то перемен-
ной - это "эпистемологический абсурд", так как эти гипотезы не
соотнесены опять же эпистемологически с интересующей нас гипо-
тезой [Там же]. Однако возможен ли вообще научный вывод,
абсолютно независящий от правдоподобия вспомогательных гипотез
или допущений, принимаемых исследователем явно и неявно для
того, чтобы сделать проверяемой его "главную" гипотезу? Ровно в
той мере, в которой возможно абсолютное и беспредпосылочное
знание.
Другой аргумент, используемый Хоппе в полемике с моделирую-
щим подходом, также неявно основан на идеях и проблемах, впервые
сформулированных в рамках этого же подхода. Как уже говорилось,
после принятия эксплицитной модели измерения, включающей в
себя и отношения между теоретическими переменными, и ошибки
измерения, иногда становится очевидной невозможность однознач-
ного "приписывания" результата содержательной гипотезе либо
артефакту измерения. Для иллюстрации здесь можно обратиться к
рассмотренным нами ранее примерам, в частности к модели "удов-
летворенность - заработная плата" (с. 111-113) или к модели "диск-
риминация меньшинства" (с. 113-116). Казалось бы, возможность
идентификации таких "отрицательных образцов" (как и возмож-
ность найти частное или компромиссное решение возникающих
проблем) гарантирована именно использованием моделирующего
подхода. Однако, с точки зрения Хоппе, сама альтернатива припи-
сывания негативного результата либо "непорядку в теории", либо
"непорядку в измерении" создает соблазн списывания теоретических
ошибок за счет недостатков измерительной процедуры и деморали-
зует исследователей. Таким образом, полагает Хоппе, критикуемый
им подход неприемлем не только с логической и эпистемологической
точек зрения, но также "нежелателен с психологической точки
зрения: использование моделей, допускающих ошибку измерения,
приводит к концу процесс проб и ошибок, необходимый для научного
прогресса" [150. Р.508 ]. Даже разделяя эволюционную концепцию
137
науки - пусть и не в попперовской радикальной версии - мы можем Интересно отметить, что одна из популярных теорий относитель-
лишь недоумевать, каким образом можно заменить культуру ясной и ного эмпирического подтверждения, развиваемая известным истори-
отчетливой экспликации всей совокупности теоретических и ме- ком и философом науки К.Глаймуром, обнаружила в моделирующем
тодических допущений, постепенно получающую признание в социо- подходе свою образцовую иллюстрацию. Более того, как мы указы-
логии под названием "моделирующий подход к измерению", тща- вали выше, стратегия научного открытия, предполагаемая этой тео-
тельной проверкой данных ("переменная за переменной"), как рией, недавно получила воплощение в компьютерной системе поиска
рекомендует Хоппе [Там же. Р.509 ]. Разумеется, проверка данных содержательных и "вспомогательных" теоретических моделей в со-
чрезвычайно важна, а техника путевого анализа, рассматриваемая циологии. К.Глаймур разработал оригинальную и в значительной ме-
Хоппе как единственное орудие моделирующего подхода, имеет ре соответствующую реальной истории научных открытий концепцию
целый ряд ограничений, помимо справедливо указанных им. Однако эмпирического подтверждения теорий [134 ]. Опираясь на взгляды
методы и "инструменты", используемые социологом, столь сильно Карнапа и раннего Рейхенбаха, Глаймур считает, что эмпирические
отличаются от искусственных закрытых систем, используемых в доказательства дают примеры теоретических утверждений, которые
качестве инструментов физического измерения, что требование их могут быть дедуцированы из доказательств при помощи других (вспо-
тщательной проверки может быть истолковано лишь как полезная могательных) теоретических утверждений. Однако (в отличие, на-
метафора, а не конкретная рекомендация. пример, от Рейхенбаха) Глаймур отрицает существование "привиле-
Однако первый, "эпистемологический" аргумент, используемый гированных" утверждений теории - аналитических истин или коор-
Хоппе, все же заслуживает более подробного рассмотрения, так как динирующих определений, - которые привязывали бы доказательство
адресован к фундаментальной и до недавнего времени не получавшей к теории. С его точки зрения, любая теоретическая гипотеза может
должного внимания черте моделирующего подхода к измерению - хо- быть использована для дедукции примера теоретического утвержде-
листской трактовке логики научного исследования и проверки гипотез. ния из совокупности эмпирических доказательств. Т.е. доказатель-
Мы не можем здесь останавливаться на анализе новейших тенденций ство подтверждает или не подтверждает гипотезу по отношению к
в философии науки, но позволим себе кратко рассмотреть те теории [134. Р.110]. В главе, посвященной методологии
результаты, которые непосредственно связаны с предметом нашего "неестественных" наук [134. Ch.7 ], Глаймур показывает, что
обсуждения. Последние работы в области логики подтверждения на- используемые в каузальном моделировании способы проверки
учных гипотез относятся преимущественно к проблеме относитель- гипотез могут рассматриваться как примеры защищаемой им так
ного подтверждения, т.е. подтверждения гипотез относительно вспо- называемой бутстреп-стра-тегии обоснования научного вывода. Здесь
могательных допущений либо "фоновой" теории. Несмотря на раз- мы не будем возвращаться к тем возможностям (и опасностям),
ногласия, существующие между представителями различных концепций которые открываются в результате конвергенции бутстреп-стратегии
(байесианской, гипотетико -дедуктивной и др.), большинство спе- проверки теорий и причинного моделирования в социологии.
циалистов в этой области согласятся с тем, что при ответе на вопрос о Другая критическая аргументация, прозвучавшая недавно в адрес
том, при каких условиях некоторое (всегда фрагментарное и частное) причинного моделирования и вспомогательных теорий измерения, бы-
эмпирическое доказательство подтверждает теоретическую гипотезу, ла развита английским социологом Р.Поусоном в программной книге
нельзя изолировать "гипотезу" и "доказательство" из целостного "Мера для мер: манифест для эмпирической социологии" [196 ]. Ана-
"поля" фоновых знаний и допущений (и, следовательно, нельзя лиз этой аргументации представляется нам самым существенным, так
построить чисто логическое объяснение процесса подтверждения ги- как собственная концепция Поусона, как нам кажется, в значительно
потезы). Т.е. всякое относительное подтверждение существенно за- большей мере опирается на критикуемый подход, чем склонен при-
висит от эпистемического статуса вспомогательных допущений и те- знать ее автор. Отметим сразу, что критика, высказываемая Поусо-
орий. Как отмечает автор критического обзора этой области: "То, что ном, абсолютно справедлива в том, что касается недостаточно прояс-
кажется сейчас необходимым, это некое холистское объяснение под- ненных и осмысленных эпистемологических оснований моделирую-
тверждения всей системы гипотез, возможно, в терминах их подтвер- щего подхода, упрощенных или даже архаичных представлений о со-
ждения относительно друг друга. То обстоятельство, что такой холизм отношении теоретического и эмпирического знания (в частности,
становится неизбежен в объяснении <процесса> подтверждения на оп- трактовки понятия причинности, разведения обсервационного и тео-
ределенной стадии, не должно вызвать никакого удивления в свете ретического языков в науке). Более того, в книге Поусона дан бле-
работы, проделанной в философии науки за последнее столетие, хотя стящий образец разбора феноменологических, антипозитивистских и
это значительно усложняет задачу объяснить подтверждение на языке иных критических претензий к измерению в эмпирической социоло-
исключительно логических отношений" [124. Р.266 ]. Этот вывод, воз- гии (которым мы, к сожалению, не уделили должного внимания).
можно, покажется неутешительным сторонникам "сильной" программы С точки зрения Р.Поусона, моделирующий подход к измерению,
логики научного исследования. Но он очевидно подкрепляет наше развиваемый Блейлоком и "американской социометрической шко-
несогласие с критикой моделирующего подхода, высказанной Хоппе. лой", является первой систематической попыткой органично встро-
138 139
ить теоретические понятия в процесс измерения. Однако, разделяя 4. Реалистская стратегия измерения
общие черты американской традиции анализа переменных (восходя- Р.Поусон подвергает критике шкалирование и моделирующий
щей к работам Лазарсфельда), моделирующий подход сводит само подход к измерению, в большей или меньшей степени разделяющие
теоретизирование к серии изящных технических решений [196. основные недостатки всех традиционных стратегий: игнорирование
Р.53]. Поэтому конечным фундаментом измерения, его операцио- интерсубъектной и межкультурной вариативности смыслов; навязы-
нально определяемыми индикаторами оказываются описания повсед- вание смысловой перспективы исследователя в процессе общения с
невного языка, произвольный и изменчивый характер которых от- исследуемыми; использование терминов естественного языка в каче-
крывает весь подход для феноменологической критики. Разграничи- стве эмпирических референтов формальной системы измерения;
вая "образы" и "индикаторы", "латентные переменные" и "наблю- влияние теоретических представлений на отбор данных. Предлагае-
даемые показатели", причинные модели измерения в сущности мая им альтернатива в значительной степени основана на постпози-
сохраняют общие онтологические посылки лазарсфельдовской кон- тивистской философии науки и реалистской версии методологии
цепции качественного измерения и взаимозаменимости индикаторов социальных наук (Р.Харре. Р.Бхаскар и др.). Для последней особен-
[196. Р.54-57]. Хотя моделирующий подход и основывается на идее но характерна критика рациональной реконструкции логики иссле-
теоретической нагруженности обсервационных понятий, он, по мне- дования в естественных науках, навязываемой позитивизмом в
нию Поусона, трактует сами теоретические понятия как переменные качестве методологического эталона для наук общественных, а также
и, следовательно, сводит их к "суммарным описаниям" или эмпири- повышенный интерес к реально используемой учеными "logics-in-
ческим генерализациям. Различие концептов теории и конкретных use", часто далекой от дедуктивно-помологической модели.
индикаторов (или, иначе, постулятивных и интуитивных понятий) По мнению Поусона, моделирующему подходу к измерению
не основано на сколько-нибудь приемлемых критериях демаркации недостает понимания роли фундаментальных механизмов
и, как мы и отмечали выше, постоянно воспроизводит проблемы (underlying mechanisms), порождающих наблюдаемые причинные
релевантного научного протокола, онтологического статуса латент- зависимости. Следует не просто задаваться вопросом о причинной
ных переменных и возможной трактовки причинного влияния тео- взаимосвязи между переменными, а пытаться понять внутренние
ретических "образов" на эмпирические "показатели" [196. Р.57]. структурные механизмы этой связи: "Например, наше знание зако-
Поусон признает, что различение "вспомогательных теорий измере- нов соотношения давления и температуры газов не является простой
ния" и "содержательных (теоретических) теорий" представляет производной эмпирических генерализаций, вычисленных на основа-
собой определенный шаг вперед в сравнении с дихотомией "образ нии надежных показателей либо на основании арифметической
-индикатор", но этот шаг, как он полагает, ведет лишь к более согласованности причинной модели, использующей вспомогатель-
изощренной версии эмпиризма. С его точки зрения, подход Блейлока ные теории, чтобы связать социальные понятия и конкретные инди-
и его последователей сохраняет дуализм "мыслимого - воспринима- каторы. Скорее любое эмпирическое доказательство взаимосвязи,
емого" (или "теоретического - эмпирического") и игнорирует "роль которым мы располагаем, рассматривается в соответствии с незави-
теории и концептуализации в перцептивных различиях, которые мы сящим от него знанием о форме газовых законов, основанным на
делаем" [196. Р.71 ]. Нам кажется, что представленный в этой книге нашем понимании поведения фундаментального механизма, т.е.
анализ концептуальных оснований моделирующего подхода позво- кинетической теории молекул газа" [196. Р.72].
ляет не согласиться с наиболее категоричными из суждений Поусона: Иными словами, теория должна не только постулировать суще-
хотя в ранних работах Блейлока присутствуют спорные или некри- ствование некоторого отношения, но и объяснять его форму посред-
тически заимствованные из эмпирицистской философии науки по- ством обращения к глубинным онтологическим структурам. Естест-
ложения, развитые им позднее представления о роли контекста и венные науки, как полагает Поусон, действительно могут преподне-
"фоновой" теории в сравнимости индикаторов, об относительности сти урок социологам, однако этот урок отличается от рецептов
разделения теоретических конструктов и наблюдаемых индикаторов позитивизма.
(и зависимости этого разделения от конкретной исследовательской Прежде всего, основой языка обсервационных понятий и показа-
проблемы) делают очевидной несправедливость обвинений в приня- телей должна служить теория, а не повседневное знание. Легко
тии понятий естественного языка в качестве "прямых наблюдений" видеть, что этот тезис является лишь более отчетливой формулиров-
или в стремлении превратить теоретизирование в "фабрикацию кой мыслей Блейлока об опасности использования "самоочевидных"
путевых диаграмм" [196. Р.71 ]. В остальном, повторим, критические понятий естественного языка в качестве социологических перемен-
замечания Р.Поусона вполне справедливы, и последние разделы этой ных и о необходимости конструирования этих переменных на базе
книги мы посвятим краткому обзору новейших тенденций в анализе осмысленных теоретических представлений (ср., например, с тем,
взаимосвязи концептуализации и измерения и попыток развития и что говорит Блейлок об использовании категориальных переменных
модификации моделирующего подхода, начав со взглядов самого в социологическом анализе).
Поусона.
140 141
Однако использование теории в качестве источника для языка на- измерению. При этом Поусон не стремится создать некую норматив-
блюдений, как известно, порождает проблему циркулярности (или ную социологическую методологию, включающую в себя правила
"порочного круга"): если термины наблюдения, которыми мы поль- "хорошего" трансформационного измерения. Эти правила (перефра-
зуемся, сконструированы на почве социологической теории, то как зируя Э.Гидденса) - и средство, и результат реальной исследователь-
они могут служить доказательством этой теории? Релятивистская и ской практики, ибо методология и реальная практика социологиче-
структуралистская критика эмпирической социологии как раз и под- ского исследования организованы рекурсивно [196. Р.125]. Поусон
черкивает "селективный", а не "объективный" характер эмпириче- сам суммирует "новые правила социологического измерения" следу-
ских данных. Чтобы показать способ решения этой проблемы, Поусон ющим образом [196. Р.324-325]:
обращается к повседневной практике естественных наук, где экспе- 1) Социологические переменные - это не дискретные "свойства",
риментирование и измерение являются основными видами исследо- а часть системы, регулируемой каким-то генеративным фундамен-
вательской деятельности и, судя по всему, не воспринимаются уче- тальным механизмом. Параметры измерения конституируются со-
ными как источник смещенных наблюдений. Он справедливо отме- циологической теорией;
чает, что в естественных науках практика измерения опирается не 2) Исходным материалом для эмпирической проверки являются
столько на аксиоматические теории шкалирования, сколько на прак- социальные регулярности. Однако сами регулярности - это не слу-
тические вопросы преобразования и передачи энергии и обработки чающиеся "сами по себе" совпадения, а результат действия порож-
сигналов. Кроме того, "совершенно ясно, что сама цель измерения <в дающих фундаментальных механизмов в конкретном контексте.
физике> - включить и воплотить в инструменте принципы, выводимые Любая эмпирическая гипотеза должна включать в себя детальную
из теоретической науки" [196. Р.106]. Т.е. задача измерения восп- спецификацию всех трех элементов, а ее проверка предполагает
ринимается как инженерная, связанная с практическим применением использование определенных средств концептуальной или экспери-
законов, теорий и гипотез теоретической физики. Стратегию, которая ментальной (квазиэкспериментальной) изоляции интересующего ис-
в этом случае используется, Поусон называет трансформационной следователя генеративного механизма от других социальных меха-
моделью измерения: ученый (инженер) измеряет свойство, констру- низмов (т.е. источников смешения). Так как, с точки зрения
ируя искусственную систему, в которой создаются взаимосвязи между Р.Поусона (в значительной мере опирающегося на работу [168]),
интересующим его свойством и другими свойствами (описываемыми статистический контроль является несовершенной заменой экс-
другими, пусть частными, работающими теориями) [196. Р.110 ]. Эта периментального, - а последний в социальных науках неприме-
интервенционистская стратегия подразумевает, что ученый не ждет ним, - то предпочтение должно отдаваться сравнительным и лонги-
милостей от природы (т.е. озарений в результате "прямого наблюде- тюдным исследованиям, позволяющим вычленить вариативность
ния") , а берет их у нее (т.е. создает и контролирует не существовав- контекста;
шую прежде ситуацию). Урок, заключенный здесь, состоит, по мысли 3) Эмпирические доказательства имеют смысл только внутри
Поусона, в том, что социологам не следует более полагаться на ре- целостных скоординированных систем (сетей) знания. Так как зна-
презентационную модель измерения с ее якобы исходными "прямыми чения любых терминов ("теоретических" или "обсервационных")
индикаторами". Они должны, по крайней мере, имитировать подлин- задаются внутри концептуальной сети, одни понятия и теории -
ную трансформационную модель. С нашей же точки зрения, моде- сравнительно лучше понимаемые и, следовательно, поддающиеся
лирующий подход к измерению едва ли нуждается в этом конкретном измерению - могут служить уточнению и проверке менее ясных
уроке, хотя и должен включить в себя другие верные положения, раз- понятий и теорий. При этом теоретизирование в социологии должно
виваемые Поусоном. держаться как можно дальше от формулировок естественного языка,
Другой интересной особенностью трансформационной модели из- стремясь создать собственную концептуальную сеть формально оп-
мерения является то, как в ней преодолевается проблема циркуляр- ределяемых понятий. Конечным результатом в этом случае станут
ности. По мнению Поусона, аргумент "порочного круга" не относит- генеративные формальные модели, -по отношению к которым только
ся к этой модели, так как теории и гипотезы, которые проверяются и возможно говорить о проверке гипотез;
при измерении конкретного свойства, отличаются от теорий и гипо- 4) То, что можно рассматривать как эмпирическое доказательст-
тез, которые при этом измерении применяются (что и позволяет во, должно не измерять "реальный мир" непосредственно и прямо,
назвать модель трансформационной) [196. Р.114-116, 120]. Мы не а соотносить конкурирующие понятия или утверждения. Именно в
станем, вслед за Поусоном, обращаться к иллюстрациям того, как точках пересечения теорий возможно обоснование научного вывода
используются преобразования различных форм энергии в физиче- (что делает научный дискурс в принципе проверяемым, в отличие
ских измерительных приборах. Отметим лишь, что Р.Поусон также от абсолютно контекстуального и открытого повседневного
приходит к идее относительного эмпирического подтверждения тео- дискурса) . Решающая же роль измерения связана с тем, что оно
рии, которая (как мы писали в предыдущем разделе) играет реша- концентрирует в себе уже существующее теоретическое знание,
ющую роль в возможности обоснования моделирующего подхода к делая
возможной интерпретацию эмпирического доказательства;
142
143
До сих пор мы лишь эпизодически касались некоторых гносеоло-
5) Безусловно, социологические данные социально конструиру- гических проблем, связанных с использованием теоретических мо-
ются. Точнее, процесс порождения данных определяется совокупно- делей измерения. Однако игнорирование этих проблем при активном
стью вербальных и социальных признаков, задающих контекст применении причинных моделей измерения в практике конкретных
коммуникации. "Навязывание" значений респонденту (или инфор- социологических исследований к концу 80-х годов породило серьез-
манту) - это реальная проблема, поскольку исследуемые понятия ные трудности в теоретической интерпретации результатов этих
-это понятия самого социолога и они не могут и не должны быть ничем исследований, а в более широком контексте - и в понимании
иным. Единственное средство смягчить эту проблему - использование взаимоотношений теоретического и эмпирического знания. Чтобы
данных, относящихся исключительно к институциональному или понять природу этих трудностей, необходимо учесть те специфиче -
взаимному (интерсубъективному) знанию. Исследователь с необхо- ские обстоятельства, которыми сопровождалось утверждение новых
димостью принимает на себя роль "концептуального наставника" (но подходов к измерению в социологии.
не "открывателя гипотез"), а респондент действует как "учащийся- Идеи причинного анализа, получившие широкую популярность в
информант". американской эмпирической социологии приблизительно во второй
Поусон принимает все неизбежные ограничения социологическо- половине 60-х годов, как уже отмечалось, имели два принципиально
го измерения, связанные с невозможностью жестко формализовать различных источника. Первым из этих источников были структур-
социологические теории (а иногда - и определить, какие из них ные модели эконометрики, описывавшие совокупность причинных
можно считать конкурирующими), с несовершенством контроля, взаимосвязей между понятиями теории и позволявшие объяснить
обеспечиваемого квазиэкспериментальными схемами, с недостижи- определенные эмпирические факты.
мостью полной концептуальной ясности в процессе коммуникации с Вторым источником были психометрические модели измерении,
респондентами и т.п. Однако он верит в возможность (и существо- использовавшиеся как средство аналитического представления отно-
вание) исследовательских практик, соответствующих его правилам шений между понятиями теории, измерительными конструктами и
(и, вероятно, рекурсивно определяющих их). Примером, и достаточ- конкретными эмпирическими показателями. И та, и другая традиции
но убедительным, являются те главы его книги, которые посвящены использовали причинные диаграммы и интерпретации. И каузальные
измерению социальной стратификации и должны, по замыслу авто- репрезентации структурных моделей, и модельные представления
ра, продемонстрировать продуктивность предлагаемой им стратегии. диагностических процедур имели сходство в способах отображения
Нам кажется, что самые существенные преимущества реалист- и языке описания. В силу этого возникла тенденция к синтезу
ской стратегии Р.Поусона54 связаны с подчеркиванием роли теории указанных традиций, причем основанием такого синтеза мыслилась
в социологическом измерении. Эта роль, по Поусону, не сводится к некоторая общая идея "причинности". Работы авторитетных специ-
некоторой "теоретической нагруженности" данных, ставшей общим алистов по моделям измерения в социологии, в частности самого
местом в работах по причинным моделям измерения, а определяется Х.Блейлока, как будто давали некоторые основания для сочетания
"теоретичностью" самого измерения, концентрирующего и воплоща- структурных моделей и моделей измерения в единых аналитических
ющего в себе наличное теоретическое знание, на фоне которого рамках и "приравнивания" взаимоотношений внутри этих двух
только и могут подлежать эмпирической проверке другие фрагменты типов моделей. В результате уже на новой почве возникло
концептуальной системы. Развиваемые им представления о порож- известное в "эксплораторной" статистике позитивистское редуциро-
дающих причинные связи фундаментальных механизмах, с нашей вание понятий теории к "истинным значениям" наблюдаемых
точки зрения, ценны скорее как попытка найти альтернативу без- переменных [185].
думному использованию "причинной" терминологии путевого ана- Возникла парадоксальная ситуация, когда в работах одних и тех
лиза. Самое же существенное в его позиции - это отчетливое и же авторов, с одной стороны, признавалось различие между теоре -
фундированное высокой философской культурой обоснование того тическими структурными моделями и моделями измерения (соответ-
положения, которое, как мы видели выше, не вполне чуждо и ствующее введенному Блейлоком различению "общей" и "вспомо-
работам Х.Блейлока: решение базисных проблем социологического гательной" теории), а с другой стороны - эти модели рассматривались
измерения лежит в сфере социологической теории. Р.Поусон исполь- как эквивалентные и взаимозаменяемые. Фактически широкая кау-
зует приписываемый Кельвину афоризм, чтобы сказать: "Если ты не зальная интерпретация измерения замещала понимание измерения
можешь теоретизировать, твое измерение скудно и неудовлет- как самостоятельной теоретически нагруженной исследовательской
ворительно" [196. Р.73]. деятельности реификацией теоретических понятий (которые уподоб-
лялись материальным объектам, "причиняющим" наблюдаемые пе-
144 ременные или являющимся "результатом" действия последних).
5. Трехуровневая концепция процесса измерения
10 И.Ф.Девятко 145
54
Отметим, что Поусон вполне осознает условность притязаний того философского на-
правления (преимущественно британского), которое идентифицирует себя как "реа-
лизм", на приоритет в вопросах генеративных причинных структур, реляционной природы
научных понятий и т.п. Реализм для него - это предельно широкое обозначение одной
философской перспективы.
Структурная модель теории - это теоретическая репрезентация Как и структурные модели, модели измерения являются элемен-
содержательных представлений об "устройстве" социальной реаль- том процесса теоретической спецификации. Последние также играют
ности. Она включает в себя понятия теории, связанные постулиру- решающую роль в планировании и интерпретации результатов
емыми причинными отношениями. Относясь к теоретическому уров- эмпирического исследования. И структурные модели, и модели
ню знания, структурные модели вместе с тем иллюстрируют суще- измерения в общем случае могут быть выражены через совокупность
ственную зависимость эмпирического исследования от теоретической линейных уравнений. Это содержательное и формальное сходство
спецификации. Постольку, поскольку входящие в структурную мо- между двумя видами моделей и привело к их частому смешению при
дель понятия теории посредством измерения "привязаны" к наблю- построении социологических теорий "среднего уровня" и, соответст-
даемым величинам, исходная структурная репрезентация становится венно, к включению эмпирических индикаторов в структурные
основанием для планирования исследования, выбора метода анализа модели теории и к отождествлению теоретических концептов с
данных и теоретической интерпретации результатов. Одним из "истинными значениями" в моделях измерения. Пример трудностей,
способов подчеркивания теоретической нагруженности любого эмпи- возникающих в результате такого смешения, будет приведен ниже.
рического исследования является как раз понимание процесса по- Здесь же мы отметим, что реакцией на эти трудности стала углуб-
строения теории как моделирования реальности, направленное про- ленная разработка философских и теоретических оснований социо-
тив эмпирицистских представлений об "объективном выводе". При- логического измерения и развитие конструктного подхода к измере-
чинность в структурных моделях теории - это теоретические пред- нию и трехуровневой концепции измерения в работах П.Хорана и
положения о том, как элементы социальной реальности воздейству- К.Бэйли [77; 78; 151 ].
ют друг на друга. Причинность здесь, подчеркнем это еще раз, не Развивая идеи конструктного подхода к измерению, П.Хоран счи-
эмпирический результат, а часть теоретической схемы, задающей тает, что стержнем проблемы является существование двух теорий
рамки эмпирического исследования (например, набор переменных, измерения. Первая из этих теорий совпадает с очерченной выше ин-
включаемых в план исследования в качестве контрольных, опреде- терпретацией "вспомогательных теорий" измерения, связывающих,
ляется содержательными представлениями об их релевантности, теоретические концепты с наблюдениями. Вторая же теория факти-
следующими из этой теоретической схемы). Но структурные модели чески постулирует, что теоретические концепты продуцируют (в при-
сами по себе не определяют эмпирические референты для входящих чинном смысле) эмпирические переменные, представляющие эти кон-
в них теоретических понятий. Следовательно, эмпирическая реали- цепты. Эти две теории не только различны, но и несовместимы. Вторая
зация структурных моделей должна включать в себя совокупность из этих теорий в психометрике получила название теории "плато-
моделей измерения, т.е. теоретических детализаций, "привязываю- новского истинного балла" (см.: [172]). С идеей "истинного балла"
щих" теоретические концепты к эмпирическим наблюдениям. были связаны многие ранние работы в психометрике. В этой идее воп-
Модели измерения, постулирующие связи между понятиями те- лощена следующая интерпретация измерения: существует мир истин-
ории и наблюдениями, одновременно являются и концептуальной ных сущностей (истинных баллов), но этот мир непосредственно не
интерпретацией наблюдаемых показателей, и эмпирической интер- доступен нашим органам чувств. Так как нам доступны лишь наблю-
претацией теоретических концептов. Без явной или неявной модели денные баллы, содержащие истинный и ошибочный компоненты, то
измерения нельзя установить связь между утверждениями теории и наша задача заключается в том, чтобы найти методические процеду-
эмпирическими гипотезами. И, с другой стороны, любая теоретиче- ры, позволяющие из измеренных баллов получать истинные значения.
ская интерпретация эмпирической взаимосвязи основывается на Т.е. эта интерпретация требует процедуры автоматической иденти-
некоторой модели измерения (отчетливая формулировка и иллюст- фикации истинного компонента наблюдений. Однако, как уже неод-
рация этого положения была дана уже в известной статье Г.Костнера нократно говорилось, не существует механического способа выделе-
[113], положившей начало систематической разработке многоинди- ния "истинного" компонента. П.Хоран формулирует это утверждение
каторного подхода). Иными словами, эмпиристский идеал "когни- следующим образом: "Хотя мы можем использовать методические
тивного исчисления" как чисто механического перехода от данных процедуры для идентификации систематических компонентов наблю-
наблюдений к понятиям теории не может быть реализован [185]. дений, эти методы сами по себе не способны однозначно и недвус-
Х.Блейлок, стремясь подчеркнуть, что взаимосвязи теоретических мысленно привязать эти систематические компоненты к какому-то
концептов и данных наблюдения сами являются продуктом теорети- истинному значению или содержанию… Коротко говоря, платонов-
ческой спецификации, обозначил отношения измерения как "вспо- ские истинные баллы, постулируемые этой теорией измерения, - это
могательную теорию", отличную от каузальных структурных взаи- метафизические сущности, которые не могут быть идентифицированы
моотношений "общей теории". Таким образом, понятие "модель на чисто эмпирической или методической почве" [151. Р.48г-
измерения" по содержанию идентично понятию "вспомогательной
теории", связывающей теоретические концепты и наблюдаемые 15
В отечественной литературе методологические проблемы перехода от теоретического
величины. концепта к эмпирическому референту и обоснования социальных показателей деталь-
но анализируются в [7. С.60-142].
146
10
147
В качестве альтернативы этой интерпретации измерения в пси- трактовки: 1) измерение - это "зависимое от данных" обнаружение
хометрике с конца 60-х годов постепенно формируется "конструкт- переменных, рассматриваемых как "истинные" сущности; 2) изме-
ный" подход к измерению [172 ]. Конструкт - это результат операции рение - это "зависимый от теории" процесс организации эмпириче-
измерения, определяемый как ожидаемое значение конкретной со- ской информации, ведущий к представлению теоретических понятий
вокупности наблюдаемых величин. Он, таким образом, обладает в эмпирических терминах, а формируемые в этом процессе пере-
всеми необходимыми статистическими свойствами и не требует менные являются продуктом теоретической спецификации. Даль-
отсылок к метафизическим сущностям. Измерительные конструкты нейшее развитие второго, конструктного подхода к измерению свя-
- это эмпирические репрезентации теоретических понятий, опре- зано с уточнением природы конструктов измерения и формулировкой
деляющих процесс эмпирического исследования. Это определение, трехуровневой концепции измерения. В двухуровневой концепции
дополненное теоретическими предположениями о характере отноше- измерения все элементы должны относиться либо к теоретической,
ний между наблюдаемыми баллами, конструктами и ошибками,
стало основанием для современного подхода к измерению в психо-
метрике и теоретическим обоснованием для статистической оценки Рис. 15. Три уровня измерения. Источник:
ненаблюдаемых факторов и переменных. Как было показано П.Хо- [151].
раном [151 ], конструктный подход к измерению по сути очень С - теоретический концепт; £е
близок к социологической интерпретации моделей измерения (осо- теоретически специфицированный эм-
бенно, обобщенной модели структурных уравнений, о которой шла пирический конструкт (£ - исследовательская
речь ранее). Однако в литературе по моделям измерения в социоло- переменная, е - ошибка измерения); х. -
гии до недавнего времени отсутствовало столь отчетливое разведение эмпирический индикатор.
очерченных двух подходов (что и порождало смешение структурных
моделей и моделей измерения). С точки зрения П.Хорана, причиной
этой путаницы была именно причинная интерпретация измерения,
предложенная с целью более глубокого содержательного понимания либо к эмпирической области, что делает невозможным существова-
процесса измерения, но в долговременной перспективе приведшая к ние элементов, относящихся (либо не относящихся) к обеим этим
обратному эффекту [151. Р.56]. Поэтому от собственно причинной областям. К.Бэйли и П.Хоран предложили трехуровневую концеп-
интерпретации моделей измерения, порождающей многочисленные цию измерения. С точки зрения этой концепции, любая модель
философские и методологические проблемы, следует отказаться. измерения связывает теоретические концепты (1-й уровень) с эмпи-
Этот отказ, однако, вовсе не подразумевает отказа от сложившейся рически наблюдаемыми показателями (3-й уровень) посредством
теории и практики построения моделей измерения. И тем более он конструктов (2-й уровень), организующих эмпирическую информа-
не означает отказа от используемых сейчас методов анализа ошибки цию согласно теоретическим критериям [77; 151 ]. Графической
измерения, применение которых первоначально обосновывалось иллюстрацией этой концепции является рис. 15, на котором изобра-
именно причинной трактовкой измерения, так как формальный жена идеализированная трехуровневая модель измерения.
аппарат этих методов был во многом заимствован из причинного Как уже говорилось, конструктами измерения являются и иссле-
анализа, использовавшегося при построении структурных моделей. довательская переменная, и ошибка измерения. Так как эти конст-
В рамках конструктного подхода и "исследовательские перемен- рукты находятся в реципрокных отношениях (в ошибку входит
ные", и "ошибки" понимаются как теоретические конструкты. Т.е., "остаток" эмпирической информации после спецификации исследо-
исследовательская переменная - это результат применения совокуп- вательской переменной), можно для простоты дальнейшего обсуж-
ности теоретических предположений о смысле тех или иных наблю- дения сосредоточиться на конструктах-переменных. Анализируя
даемых значений, а ошибка - "остаток" наблюдаемых значений преимущества трехуровневой модели измерения для предотвраще-
после вычленения их теоретически релевантной доли [151. Р.48]. ния смешения структурных моделей и моделей измерения, П.Хоран
Отсюда ясно, что оба эти реципрокных конструкта обусловлены и приводит широко известный пример из области исследований "соци-
организованы в согласии с теоретической спецификацией, содержа- ально-экономического статуса", неоднократно рассматривавшийся в
щейся в модели измерения (и, значит, не являются эмпирическим дискуссиях по проблемам измерения.
воплощением "истинных сущностей" или "истинных ошибок"). Кон- Одной из первых шкал измерения общего престижа профессий
структы измерения - это эмпирические представления теоретических была шкала Национального центра исследований общественного
концептов, вводимых для интерпретации отношений эмпирического мнения, исходный вариант которой был предложен С.Нортом и
мира. П.Хаттом (NORS Prestige scale). Эта шкала основывалась на субъ-
Таким образом, за двумя описанными подходами к интерпрета- ективных оценках конкретных профессий для репрезентативной
ции измерения (двумя теориями измерения) стоят две следующие выборки населения США. Однако эта шкала не могла быть распро-
странена на весь огромный список существующих профессий и
148
149
возникла необходимость в другой модели измерения для оценивания ясным и очевидным здравому смыслу. Таким образом, понятие
профессий в социально-экономическом сводном индексе профессий, "прямого" измерения предполагает, что в ситуации общего согласия и
который мог бы заменять (рейтинг. О.Дункан предложил такой интуитивной ясности опосредующее звено (конструкт) может быть
индекс (SEI,, основанный на уровне образования и дохода для опущено в модели измерения. Однако на самом деле измерение
мужчин в профессиональных категориях национальной переписи. "пола" подразумевает разные эмпирические индикаторы в разных
При этом он подчеркивал, что SEI - это модель измерения, могущая случаях, и это различие индикаторов определяется разной
репродуцировать баллы NORC, а не структурная модель теории, теоретической спецификацией эмпирических конструктов. Для
описывающая, как "устроено" оценивание престижа. Однако, как определения гражданского пола достаточно прямого вопроса, для
отмечает П.Хоран, многие современные исследователи склонны вос- определения пригодности к участию в женских соревнованиях
принимать индекс социально-экономического статуса как некую по легкой атлетике - визуального осмотра, для оценки
модель социальной структуры, и возникла целая полемика о том, маскулинности-фемининности необходимы специальные
является ли индивидуальное оценивание престижа основанным на психологические тесты, а в оценке гормонального статуса -
восприятии социальных и экономических характеристик профессии биохимические анализы. Следовательно, сам по себе теоретический
(см.: [151. Р.44-46]). Этой путанице между моделями измерения и концепт "пол" всегда подлежит спецификации в конструкте
теории, по мнению П.Хорана, способствовало отсутствие четкого измерения. Эта спецификация может происходить неявно и
разграничения между теоретическими концептами, конструктами и основываться на здравом смысле, создавая впечатление "прямоты",
индикаторами, вытекающее из двухуровневой модели измерения но может (и в идеале должна) быть эксплицирована, например, с
(теоретический концепт-индикатор). Вполне возможно, что учетом сложных моделей психосексуальной дифференциации или
теоретическая модель, устанавливающая каузальную связь между других содержательных соображений. Аналогичные рассуждения
восприятием профессионального уровня образования и восприятием могут быть проведены для признака "возраст". В работе
профессионального дохода, с одной стороны, и индивидуальным Ю.Н.Толстовой [51. С.41-42] пример с возрастом обсуждается в
оцениванием профессий, с другой стороны, верна. Однако контексте дискуссии о роли содержательных соображений при
доказательство этого не может быть получено из анализа модели определении типа шкал в социологии (речь идет о недостаточности
измерения социально-экономического статуса. чисто формального подхода, основанного на "физическом" способе
На наш взгляд, самым существенным достоинством трехуровне- получения данных). Детальное обсуждение последствий "наложе-
вой модели являются все же те возможности, которые она открывает ния" двухуровневой интерпретации на трехуровневый процесс из-
для прояснения проблемы "прямого" и "непрямого (косвенного)" мерения содержится в работе К.Бэйли [77]. Типичным случаем
измерения в социологии. На чем основано представление о возмож- такого слияния является игнорирование различий между теоретиче-
ности прямого измерения в социологии? Чтобы ответить на этот скими концептами и конструктами, репрезентирующими эти кон-
вопрос, можно вновь обратиться к статье Х.Блейлока, анализировав- цепты в конкретном социологическом исследовании. Как отмечает
шейся в предыдущей главе [82 ]. В этой статье возможность прямого П.Хоран, в работах Х.Блейлока (например, [81. Р.55]) можно найти
различение между теоретическими понятиями (концептами), латен-
измерения обосновывается тем, что существуют теоретические пере- тными переменными (конструктами) и наблюдаемыми индикаторами.
менные, настолько близкие к операциональному уровню, что изме- Однако это различение, не будучи закрепленным в трехуровневой
рение может рассматриваться как прямое. Примером могут служить модели измерения, не смогло предотвратить двойственности в
переменная "возраст" и признак "пол" [82. Р. 19]. Автор, правда, интерпретации моделей измерения в других работах. Эта
оговаривает, что предположение о прямом измерении этих свойств двойственность и связанные с ней проблемы и приводили к
не всегда верно и содержит долю упрощающей условности, но ни в интерпретации, наблюдаемых значений как причинно
этой, ни в более поздних работах не дает общего определения обусловленных концептами теории, а "неявных переменных" -
оснований или условий, приводящих к такому упрощению. На самом одновременно и как теоретических конструктов, и как невидимых
деле, как показано в работах К.Бэйли [77] и П.Хорана [151], сущностей, "производящих" эмпирические наблюдения.
основанием для утверждения о прямом характере измерения явля- Очень серьезным аргументом в пользу принятия моделирующего
ется предположение о простом взаимооднозначном соответствии подхода к измерению (не основанного на онтологическом постулате
между концептом теории и некоторым эмпирически наблюдаемым каузальности) и представления о трехуровневой организации этого
индикатором (этому предположению соответствует пунктирная связь процесса служит проделанный П.Хораном анализ проблемы измеря-
"а" на рис.15). Однако это упрощающее предположение само осно- емых переменных в социологии. Следуя предложенному К.Лэндом
вано на принимаемой "по общему согласию" и опирающейся на разграничению, П.Хоран выделяет два типа неизмеряемых перемен-
обыденное знание теоретической спецификации того, что мы подра- ных. Неизмеряемая переменная "типа-1" - это конструкт (специфи-
зумеваем под концептом "пол" или "возраст". Т.е. конструкт ( е ) , цированный для теоретического понятия), имеющий один или не-
представляющий концепт "пол", например, имплицитно считается сколько эмпирических индикаторов. Переменная этого типа опреде-
150 151
лена для моделей измерения и не требует постулирования собственно
причинных связей в модели. Например, в [214] предлагается моде-
лирующий подход к анализу ошибки измерения, и неизмеряемые ВМЕСТО ЗАКЛЮЧЕНИЯ:
переменные здесь - это переменные "типа-1". Неизмеряемая пере- О РАДИКАЛЬНОЙ КРИТИКЕ
менная "типа-2" используется в структурных моделях теории как "КОЛИЧЕСТВЕННЫХ" ПРОЦЕДУР В СОЦИОЛОГИИ 1
промежуточная, опосредующая причинные связи между измеряемы-
ми переменными (т.е. речь идет о концептах теории). П.Хоран
полагает, что использование каузальных репрезентаций и в струк-
турных моделях, и в моделях измерения ведет к смешению описан- Промежуточный жанр этой книги - нечто вроде симбиоза краткого
ных двух типов переменных. Это смешение не приводит к слишком курса истории и критико-аналитического обзора - имеет и множество
уж драматическим последствиям, пока "разные" неизмеряемые пе- недостатков, и одно явное преимущество: возникает возможность уйти
ременные не появляются в одном аналитическом контексте [151. от "закономерностей" исторического развития и прогрессивных ме-
Р.53]. Однако эти проблемы возникают, как только разного типа тодологических рекомендаций. С некоторой долей уверенности можно
модели и разного типа переменные должны быть включены исследо- принять лишь общий вывод: диагностические измерительные проце-
вателем в единый анализ. Сталкиваясь с двумя разными ситуациями, дуры в социологии не имеют абсолютного обоснования и полных эпи-
описанными одним термином, исследователь начинает трактовать стемологических гарантий, так как их достоверность существенным
эти ситуации как взаимозаменяемые. С точки зрения П.Хорана, образом зависит от достоверности содержательных теоретических
особо изобилует примерами по необходимости совместного исполь- представлений, которые явно или неявно принимаются социологами.
зования моделей измерения и структурных моделей и, соответствен- Однако же число таких теоретических перспектив - и, соответст-
но, их смешения, литература по моделям типа MIMIC, т.е. моделям, венно, число возможных и существенных для измерения "онтологи-
включающим множественные индикаторы и множественные причи- ческих" допущений - небезгранично и в большинстве случаев можно
ны. Широкое распространение прикладных программ типа LISREL указать на локально обоснованную совокупность процедур и крите-
для многомерного анализа переменных делает особенно нежелатель- риев качества, которая дисциплинирует рациональное эмпирическое
ным сохранение неопределенности в трактовке процесса измерения исследование относительно данной теоретической перспективы. Ча-
и типов неизмеряемых переменных, игнорирование различия между стным случаем такой совокупности диагностических процедур и кри-
структурными моделями и моделями измерения. териев является использование причинных моделей измерения, так
Дальнейшая разработка конструктного подхода к измерению и как последние в принципе применимы ко всем социологическим те-
трехуровневой модели процесса измерения, на наш взгляд, могла бы ориям, допускающим структурную детерминацию социального дей-
открыть новые перспективы для более глубокого понимания проблем ствия. В некоторых теоретических перспективах - например, во вдох-
надежности и валидности социологического измерения, которые пока новляемых феноменологическим подходом - эта "возможность мето-
не получили удовлетворительного и бесспорного решения. Анализи- дологии" остается в основном неосуществленной. Причины часто за-
руя сегодняшнее состояние моделирующего подхода к измерению, ключаются в принципиальных трудностях, создаваемых особенностя-
следует отметить и ту роль, которую он играет в прояснении ми "образа" социального мира, который принимается внутри данной
философских проблем соотношения теории и конкретного социоло- ориентации: так, принятие последовательно волюнтаристского пони-
гического исследования, а также роли измерения как необходимой мания социального действия по совести должно вести к солипсизму.
составляющей теоретической спецификации, которая лежит в осно- Немаловажны и исторические обстоятельства институционального за-
вании любого анализа эмпирических данных и, в конечном счете, в крепления социологических "школ мышления", часто обострявшие
создании внутри самой эмпирической социологии такой интеллекту- содержательные расхождения во взглядах. Поиски своей "диагности-
альной атмосферы, которая (если воспользоваться выражением ческой процедуры" идут, тем не менее, почти повсеместно: и в кри-
П.Хорана) может сделать ее "неэмпиристской без того, чтобы стать тической социологии, и в этнометодологии, и в феминистской теории.
антиэмпирической" [151. Р.57]. Эти поиски нередко описываются как некая единая традиция "каче-
ственной методологии", противопоставляемая традиции "количест-
венной методологии". Ценность многих результатов, полученных в
" качественной" социологии в последние годы, несомненна, и мы на-
деемся, что отечественный читатель сможет в ближайшее время са-
В данном разделе использованы материалы статьи "Qv Q-проблема: опыт социологи-
ческого анализа дилеммы "качественного" и количественного" подходов в социологии" ,
написанной в соавторстве с Г.С.Батыгиным (в печати).

153
мостоятельно в этом убедиться. Ценность же самого мнимо-очевид- На первый взгляд, общей платформой "левого" лагеря является
ного противопоставления качественных и количественных методов некий антисциентистский импульс, однако и сам антисциентизм
в социальных науках далеко не бесспорна. Вспыхивающая время от скрывает в себе возможность дальнейших аналитических разграни-
времени дискуссия о качественной и количественной методологиях чений: антисциентизм этнометодологов скорее основан на идеях
("Q v Q" -дискуссия) едва ли решает исследовательские проблемы интерсубъективности и зависимости социального знания от контек-
внутри какой-либо из существующих теоретических перспектив. Ос- ста, т.е. в интересующем нас аспекте может рассматриваться в
новной мишенью для самой радикальной критики, позволяющей качестве одной из версий эпистемологического релятивизма (если не
к тому же сконструировать некую "групповую солидарность" сто- нигилизма). Марксистская же теория и близкие ей версии структу-
ронников качественных подходов, является "количественная" диаг- рализма строят критику науки и научного истеблишмента на идее
ностическая процедура в социологии. Предыдущее изложение, как неразделимости знания, интереса и власти (хотя некоторые из
нам кажется, показывает, что никакой единой и неделимой " коли- теоретиков принимают заодно и тезис о дискурсивной природе
чественной" диагностической процедуры в социологии никогда не теории).
существовало. Остается лишь сказать несколько слов о продуктив- Феминистская критика социальной науки также охотно исполь-
ности и обоснованности самого противопоставления "количественно- зует идею воспроизводства сложившихся властных отношений при
го" и " качественного" и о сопутствующей ему радикальной критике получении и распределении знания, в результате чего сам доступ к
"позитивистских" методов. познавательным ресурсам представляется структурированным и ор-
Дилемма качественное - количественное находится в самом цен- ганизованным в интересах сохранения мужского господства в науке.
тре грандиозной эпистемологической кучи и, по мнению многих, Однако феминистская методология менее восприимчива к глубин-
является самым современным и модным ее компонентом. Даже ным эпистемологическим постулатам теоретического марксизма,
попытка строгого описания этой дилеммы повлечет за собой необхо- касающимся обманчивой, "фантомной" природы эмпирически на-
димость расчленения и описания других "слоев" или ракурсов, блюдаемых социальных факторов, за которыми кроются истинные
имеющих уже устоявшуюся дурную репутацию. Здесь достаточно механизмы событий: классовые интересы марксистов или даже
упомянуть лишь некоторые из них: научный подход и другие структуры К.Леви-Стросса. Феминистская методология, таким обра-
подходы к знанию, позитивистская и гуманистическая модели соци- зом, лишь ставит под сомнение объективность "мужской" интерпре-
ального знания, единство-различие метода естественных и социаль- тации общества и преимущественное право патриархов означивать,
ных наук, значимость эмпирического обоснования социологии versus классифицировать и интерпретировать объективные эмпирические
дискурсивный, конвенциональный характер социологического по- данные, не посягая на саму идею объективности и эпистемический
знания и т.п. статус наблюдаемой реальности. Поэтому в работах, выполненных в
Каждый из названных ракурсов или "слоев" может быть описан феминистской традиции, наряду с критикой сексизма в официальной
как аналитически самостоятельная смысловая оппозиция. Нередко статистике (см., например: [192]) часто присутствует и вполне
участники методологических дискуссий, не затрудняясь аналитиче- обычная статистическая аргументация, почти немыслимая в струк-
ским разграничением возможных смыслов, выбирают не отдельные туралистских эссе. Вместе с тем, феминистское теоретизирование в
позиции, а, образно говоря, стороны этой эпистемологической кучи. социальных науках нередко опирается на наследие понимающей
Соблазн тут достаточно велик, так как некоторые из позиций социологии, и здесь оно ближе к этнометодологии. Именно убежден-
действительно связаны между собой не только исторически, но и ность феминистских теоретиков в существенности качественного
идейно. Скажем, по "левую" (условно) сторону кучи обычно лежат понимания социальных явлений (Verstehen), дополненная гумани-
и антинатурализм, и методологический релятивизм, и недоверие к стическим идеалом и импульсом освобождения от "нормальной",
объективности как таковой и объективности эмпирического доказа- устоявшейся социальной структуры, приводит их в лагерь качест-
тельства в частности. Здесь, "слева", часто располагаются лагерем венной методологии. Однако отмеченная выше умеренность критики
и наиболее "теоретические" марксисты (типа Л.Альтюсера), и фе- научного познания со стороны феминистской теории препятствует
министские критики традиционной социологической методологии, и принятию самых радикальных позиций в спорах о качественном и
этнометодологи. Своих оппонентов, оказавшихся "справа" от вооб- количественном, происходящих уже "на территории" философии
ражаемой разграничительной линии, они нередко списком зачисля- науки, - например, в битве натурализма и антинатурализма, в
ют в "позитивисты". Впрочем, теперь уже признано, что слово которой больше всего шансов у третьей стороны, "денатурализован-
"позитивизм" не имеет ни однозначно определенного смысла, ни ного" эмпиризма в духе Куайна.
замкнутого множества эмпирических референтов (см., например: Все эти запутанные обстоятельства с неумолимостью физического
[139]) и значительно чаще используются "эмпиризм" или "мужской закона ведут к появлению "химер", ломающих любые аналитиче-
шовинизм", еще не вполне утратившие строго терминологическое ские и пространственные ("лево - право") разметки упомянутой
значение. кучи. Примером такой "химеры" может служить, скажем, компью-
154 15
5
терная программа для обработки результатов качественных, этно- Определенная теоретическая модель действия порождающего меха-
графически ориентированных феминистских эмпирических исследо- низма организует сам язык наблюдения, создавая условия для того,
ваний. Эта программа называется "Nudisf и имеет достаточно чтобы " эмпирические факты" либо " наблюдаемые регулярности"
серьезное методологическое обоснование [204 ]. случались (или не случались). Сказанного достаточно, чтобы
Излишне говорить, что в "правый" угол кучи часто попадают не читатель заметил и оценил удивительное сходство реалистской и
менее разнородные квазисоюзники, позиции которых в некоторых марксистской " онтологии": в обоих случаях истинные механизмы
существенных отношениях далеки, отвечают на совершенно разные социальной реальности скрыты за фасадом видимого и вполне ло-
вопросы и даже противоположны. Ограничимся лишь одним приме- гично, например, трактовать классовые интересы "в себе" как ге-
ром. Скажем, и для "жестких" социологических методологов, пре- неративные механизмы любых конфликтов3. Поэтому самые сильные
имущественно американцев, и для занимающихся метатеорией реа- аргументы, используемые при критике социологического анализа
листов (Р.Бхаскар, Р.Харре) большая часть критики "слева" - это переменных (в духе Лазарсфельда), в неомарксистской критической
идеологическая оппозиция самой науке как рациональному предпри- социологии и в реалистской перспективе практически совпадают
ятию2. Однако в том "слое" кучи, где расположены традиционные (сравним, например, [66] и [196]).
дилеммы философии науки, единство "жесткой" методологии и Таким образом, дискуссия о "качественной" и "количественной"
реализма оказывается проблематичным. методологиях не может быть даже понята и исторически верно ре-
Представления большинства "жестких" социологических методо- конструирована без отсылок к контекстам, интересам и идеологиям.
логов распределены (очень приблизительно) вдоль континуума "ло- Именно поэтому она не может быть разрешена в каком-либо строгом
гический позитивизм - критический реализм - эволюционная эписте- смысле. Известный британский социолог, неоднократно писавший и
мология". Изрядная часть "жестких" методологов полагает, что един- о качественных методах, пришел к выводу, к которому мы при-
ство метода различных наук обеспечивается так или иначе сущест- ходим только сейчас, значительно более коротким путем:"... про-
венной ролью эмпирического подтверждения научной теории. Как блема с модами (интеллектуальными) заключается в том, что они
уже говорилось (см. главу IV данной работы), реализм строит защиту часто прямо противоположны критическому мышлению: "линия пар-
научного метода на постпозитивистстком образе научного исследова- тии" куда легче сочетается с выкрикиванием лозунгов, чем с подлин-
ния, переопределяющем природу самой науки. А именно, реалисты ной работой. Сообщение, которое я вывожу из этого наблюдения, за-
отвергают позитивистское убеждение в решающей роли эмпириче- ключается в том, что полярности, на которых базируется различие
ских наблюдений, в примате, так сказать, языка наблюдений, позво- "качественное - количественное", должны быть (используя модный
ляющих проверить утверждения науки. Однако же они не отрицают термин) деконструированы" [215. Р.58 ]. Иначе говоря, следует по-
ни само существование эмпирически наблюдаемого мира, ни значи- нять, почему различные исследовательские "практики" в некоторых
мость для теории неких "наблюдаемых фактов". Разумеется, для ре- случаях тематизируются как "качественные" либо "количествен-
ализма - как и для любой философии науки, возникшей после ло- ные". Почему какие-то, зачастую весьма старые, дилеммы социологии
гического позитивизма, - не существует никаких "чистых сенсорных или социологические перспективы - например, "структура" и "дей-
данных" и всякое наблюдение является теоретически-нагруженным. ствие" либо " социальная наука" и " социальная политика" - вновь
Реализм не доходит до полной релятивизации фундамента науки и, используются как аргументы и альтернативы в " Q v Q" -дискус-
конечно, не заявляет, что все "наблюдаемые факты" полностью оп- сии? Почему, наконец, нам следует выбирать между "количествен-
ределяются теориями или, того пуще, ценностями и интересами ис- ным" и "качественным", как если бы это был действительный выбор
следователя. Как и некоторые другие теоретические перспективы между действительно различными возможностями?
постпозитивистской эпохи, реализм склоняется к идее "сетевой струк- Мы не станем здесь ворошить всю историю социологии в поиске
туры теоретических понятий" (определяемых взаимно) и к модели ответов: важно знать, что ответы находятся именно там. Какие-то
относительно эмпирического подтверждения, т.е. подтверждения те- темы все же нужно выявить. Во-первых, в полном соответствии с
оретических гипотез относительно совокупности других теоретиче- labelling theory нынешние сторонники качественной методологии,
ских гипотез. Этой ценой реализму удается спасти не только идеал т.е. социологи, называющие себя так и/или принимаемые за
научности, но и тезис единства метода (Р.Бхаскар). Разумеется, ре- таковых коллегами, безусловно сделали первый ход, ибо именно они
алистская картина того, "что на самом деле делают ученые", ради- ввели в социологический язык саму классификацию и начали после-
кально отличается от логико-позитивистской. Не обсуждая здесь де- довательные попытки определить ее критерии, чтобы выявить аут-
тали этой картины, отметим лишь тот существенный для нас факт, сайдеров.
что в центре ее оказываются онтологические "порождающие меха- 157
низмы", ответственные за многообразие эмпирически наблюдаемого.
156
3
Здесь с реалистами и марксистами соседствуют другие почтенные" онтологии"
психоанализ с идеями "симптомов", "сил" и "истолкования" и даже платоновская
2
Эта оценка обычно не распространяется на феноменологическую критику. теория знания, совсем не метафорически описывающая земную судьбу" эйдосов".
Фундаментом этих попыток стала критика количественных подхо- тех, кого принято называть "количественными методологами". От-
дов, содержащаяся в классических текстах современной качествен- давая должное влиянию феноменологической и марксистской крити-
ной традиции (см., в частности: [108; 208; 141; 223]). Концепция ки на развитие количественных методов в социологии последних
качественной методологии, которая может быть воссоздана из этих четырех десятилетий, мы все же хотим заметить, что история
действительно блестящих книг, относительно стройна в том, что становления социологического измерения содержит много доказа-
касается "онтологии" социального. (Впрочем, и теоретические пер- тельств систематического и часто плодотворного интереса" пози-
спективы могут различаться. Книга А.Сикьюрела, например, ближе тивистов" к проблемам рефлексивности, значения, культурного
к традиции, восходящей к А.Шюцу, тогда как Х.Шварц и Дж.Джей- контекста и определяющей роли теории.
кобс основываются на идеях Г.Зиммеля.) Куда менее согласова- Чем более корректно определяется "позитивистская методология"
ны собственно методологические взгляды. Здесь само понятие в текстах, так или иначе посвященных качественным методам,
качественной методологии утрачивает определенность, простираясь тем очевиднее фантомность этого понятия. Позитивистскую методо-
от этнометодологии как теории и практики до строго определяемого логию обычно обвиняют в игнорировании "естественно случающих-
этнографического метода "включенного наблюдения", возводимого ся" данных и преимущественном интересе к стандартным опросам и
к культурной антропологии и Чикагской школе. Поиск же общего и официальной статистике. Еще один видовой признак "позитивизма"
различного во взглядах качественных методологов на то, что собст- заключается в использовании модели объяснения, подменяющей
венно является "демаркационной линией" для качественной мето- поиск логических или причинных связей статистическим выводом
дологии, ведет именно к той эпистемологической куче, о которой мы и корреляциями (ср., например: [181 ]). Соответственно, валидность
уже говорили. Вместо того, чтобы снова разбираться в том, все ли "позитивистских" исследований основана на статистическом методе
качественные методологи верят (или должны верить) в Verstehen и и понятии репрезентативности, тогда как качественный подход
интеллектуальную эмпатию/любовь к угнетенным, продуктивнее связывает свое понимание валидности исследования с обоснованно-
обратиться к историческому анекдоту. стью его теоретической базы.
Известно, что одним из отцов-основателей этнографического Но так ли непроблематичны естественность и чистота "естествен-
метода был польский антрополог Бронислав Малиновский. В сумя- ных" данных? Даже классический образец "включенного наблюде-
тице первой мировой войны он был выслан в тихоокеанские колонии ния" - книга Уильяма Фута Уайта о жизни бедных итальянских
и позднее опубликовал несколько классических монографий о жите- кварталов "Street Corner Society" - не содержит никаких очевидных
лях Тробриандовых островов. Многие антропологи и социологи гарантий от возможных "смещений", связанных с присутствием
полагали, что труды Малиновского - великолепная иллюстрация автора. Сведения о структуре взаимодействия в уличной шайке,
метода полевой работы, основанного на эмпатическом вживании в полученные Уайтом, во многом основаны на личном, взаимообога-
смыслы и ценности иной культуры. Публикация личного дневника щающем и скрепленном разными мелкими услугами общении автора
Малиновского (1967) стала настоящим ударом для профессиональ- с Доком и его ребятами (что неоднократно подчеркивается и в книге
ного сообщества. Этот не предназначавшийся для широкой аудито- Уайта). В литературе показано, что "Street Corner Society" и другие
рии документ изобличал в Малиновском крайне эгоцентричного аналогичные работы по своему стилю и содержанию следовали не
невротика, занятого исключительно собой и не только не уважавшего научным канонам, а жанру "социальной публицистики". Разумеет-
тробриандцев, но и не испытывавшего к ним никакой симпатии. ся, это не доказательство "нищеты этнографизма". Но это явное
Нельзя не согласиться с Дж.Кёрком и М.Миллером, полагающими, подтверждение общности проблем по обе стороны методологической
что: "Это разоблачение компрометирует не достоверность или каче- границы. Вполне очевиден и "сконструированный" характер обви-
ство профессиональных достижений Малиновского, а миф о том, что нений, кас