Академический Документы
Профессиональный Документы
Культура Документы
Edited by
Daniel Kahneman
University of British Columbia
Paul Slavic
Decision Research
A Branch of Perceptronics, Inc.
Eugene, Oregon
Amos Tversky
Stanford University
This work in preparing this book was supported by Office of Naval Research
Grant N00014-79-C-0077 to Stanford University and by Office of Naval
Research Contract N0014-80-C-0150 to Decision Research.
Cambridge
UNIVERSITY PRESS, 2001
Даниелъ Канеман П ауль Словак
А м ос Тверски
Принятие решений
в неопределенности
Правила и предубеждения
П од редакцией
Заслуж енного работ ника высшей ш колы
Российской Федерации, доктора психологических наук,
проф. Г. В. Суходольского
Перевод с английского
Гуманитарный Центр
Харьков, 2005
УДК 1 5 9 .9 2 2 .2 7
ББК 8 8 .5 3
You сага see а fundam ental work on psychology of decision-making . The references
to separate works of these authors can be found often enough in the academ ic
literatu re , Z?uZ Jfre complete volume of these articles has been published in Russian
for the first tim e . T7*e issue о / £/us froofe is undoubtedly an im portant event for the
experts in the field of m anagem ent , strategic planning , decision-making , consumers*
conduct etc .
TTie froofe is о / in terest to the experts in the field of m anagem ent , econom y ,
psych ology , iu theory as well as in p r a c tic e , irfro d eai u;i£/i such com plex and
in terestin g sphere of hum an action as decision-m aking.
Все права защищены. Никакая часть данной книги не может быть воспроизведена в
какой бы то ни было форме без письменного разрешения владельцев авторских прав. Права
на публикацию книги на русском языке принадлежат издательству «Гуманитарный
Центр».
© Cambridge University Press, 2001
© Институт прикладной психологии «Гу
ISBN 0-521-28414-7 (англ.)
манитарный центр», перевод на русский
ISBN 966-8324-14-5 язык, оформление, 2005
Содержание
Часть I: Введение....................................................................................... 15
1. П ринятие реш ений в условиях неопределенности: правила и
предубеждения..................................................................................... 17
као
Часть X: Поскриптум...............................................................................
34. К вопросу о статистической интуиции........................................... 565
35. Варианты неопределенности........................................................... 582
Л итература................................................................................................ 595
Предисловие научного редактора
Научный редактор ,
доктор психологических наук ,
профессор СПбГУ
Г £ . Суходольский ,
Санкт-Петербург , 2004 г .
Предисловие авторов
Даниелъ Канеман
Пол Словик
Амос Теерски
Часть I
Введение
1. Принятие решений в условиях неопределен
ности: правила и предубеждения*
*Эта глава впервые появилась в Science, 1974,185,1124-1131. Авторское право© 1974 при
надлежит Американской Ассоциации достижений науки. Переиздано в соответствии с раз
решением.
18 ВВЕДЕНИЕ
обнаруж ить в интуитивной оценке вероятности. В этой книге описываются
три вида эвристик, которые использую тся для оценки вероятности и про
гнозирования значений величин. П риводятся предубеждения, к которым
ведут эти эвристики, а такж е обсуждается практическое и теоретическое
значение этих наблюдений.
И ллю зи я валидност и
К ак мы уж е говорили, люди часто делают прогнозы, вы бирая исход (напри
мер, профессию), которы й является наиболее репрезентативным по отно
шению к входным данным (например, описание человека). То, насколько
они уверены в своем прогнозе, зависит, прежде всего, от степени репрезен
тативности (то есть качества соответствия выбора входным данным) безот
носительно факторов, которые ограничиваю т точность их прогноза. Таким
образом, люди вполне уверены в прогнозе, что человек является библиоте
карем, когда дано описание его личности, которое соответствует стереотипу
библиотекаря, даж е если оно скудно, ненадежно или устарело. Необосно
ванная уверенность, которая является следствием удачного совпадения
предсказываемого результата и входных данны х, мож ет назы ваться иллю
зией валидности. Эта иллю зия сохраняется даже тогда, когда испытуемый
знает факторы , которые ограничиваю т точность его прогнозов. Вполне рас
пространенным является вы сказы вание, что психологи, которые проводят
выборочные интервью , часто обладают значительной уверенностью по по
воду своих прогнозов, даж е если они знакомы с обширной литературой, ко
торая показы вает что в выборочных интервью вы сока вероятность ошибок.
П родолжительная уверенность в правильности результатов клинического
выборочного интервью , несмотря на повторные свидетельства его неадек
ватности, является достаточным свидетельством силы этого эффекта.
Внутренняя согласованность образца входных данных является основным
показателем степени уверенности в прогнозе, основанном на этих входных
данных. Например, люди выражаю т больше уверенности в прогнозе средне
24 ВВЕДЕНИЕ
го балла успеваемости студента, чей табель за первый год обучения состоит
полностью из В (4 балла), чем в прогнозе среднего балла студента, в чьем табе
ле за первый год обучения много оценок, как А (5 баллов), так и С (3 балла).
Высоко согласованные образцы наиболее часто наблюдаются, когда входные
переменные очень избыточны или взаимосвязаны . Следовательно, люди
склонны быть уверенными в прогнозах, основанных на избыточных входных
переменных. Однако элементарное правило в статистике корреляции, утвер
ж дает, что, если у нас есть входные переменные определенной валидности,
прогноз, основанный на нескольких таких входных данных, может дости
гать более высокой точности, когда переменные независимы друг от друга,
чем если они являю тся избыточными или взаимосвязанными. Таким обра
зом, избыточность входных данных уменьшает точность, даж е если она уве
личивает уверенность, таким образом, люди часто уверены в прогнозах, ко
торые, скорее всего, будут ошибочными (K ahnem an и Tversky, 1973,4).
Доступность
Бывают ситуации, в которы х люди оцениваю т частоту класса или вероят
ность событий на основе легкости, с которой они вспоминают примеры слу
чаев или события. Н апример, можно оценивать вероятность риска сердеч
ного приступа среди людей средних лет, вспоминая такие случаи среди сво
их знакомы х. П охожим образом некто может оценивать вероятность того,
что некоторое бизнес-предприятие потерпит неудачу, представляя себе раз
личные трудности, с которыми оно могло бы столкнуться. Эта эвристика
оценки назы вается доступностью. Доступность очень полезна для оценки
частоты или вероятности событий, потому что события, принадлеж ащ ие
большим классам , обычно вспоминаю тся и быстрее, чем случаи менее час
тых классов. Однако на доступность воздействуют и другие факторы , кроме
частоты и вероятности. Следовательно, уверенность относительно доступ
ности ведет к вполне прогнозируемым предубеждениям, некоторые из ко
торых проиллю стрированы ниж е.
26 ВВЕДЕНИЕ
Предубеж дения, обусловленные степенью восст анавливаемост и
событий в пам ят и
Когда размер класса оценивается на основе доступности его элементов, класс,
элементы которого легко восстанавливаю тся в пам яти, будет казаться бо
лее многочисленным, чем класс такого ж е размера, но элементы которого,
менее доступны и хуж е вспоминаются. При простой демонстрации этого эф
ф екта, испытуемым зачитали список известных людей обоих полов, и за
тем попросили оценить, было ли в списке больше м уж ских имен, чем ж енс
ких. Различны е списки были предоставлены разны м группам тестируемых.
В некоторых из списков муж чины были более известны, чем ж енщ ины , а в
других, ж енщ ины были более известны, чем муж чины . В каж дом из спис
ков, испытуемые ошибочно считали, что класс (в данном случае пол), в к о
тором были более известные люди, был более многочисленным (Tversky и
K ahnem an, 1973,11).
В дополнение к узнаваемости, имеются другие факторы , такие к ак яр
кость, которая влияет на восстанавливаемость событий в пам яти. Н апри
мер, если человек наблюдал воочию пож ар в здании, то он будет считать
возникновение таких несчастных случаев, наверное, более субъективно ве
роятны м, чем, если бы, он прочитал об этом пож аре в местной газете. Кроме
того, недавние происш ествия, вероятно, будут вспоминаться несколько про
щ е, чем более ранние. Часто бывает, что субъективная оценка вероятности
возникновения дорожных происш ествий временно повыш ается, когда че
ловек видит около дороги перевернутый автомобиль.
Недостаточная «корректировка»
Для демонстрации эффекта «привязки », тестируемых просили оценить раз
личные величины , вы раж енны е в процентах (например, процент А фрикан
ских стран в О рганизации Объединенных Н аций). Каждой величине с по
мощью случайного выбора в присутствии тестируемых, был присвоен но
мер от 0 до 100. Тестируемых вначале попросили указать, больше или мень
ше этот номер, чем значение самой величины , и затем оценить значение этой
величины, двигаясь в большую или меньшую сторону относительно его но
мера. Различным группам тестируемых предлагались различные номера для
каждой величины , и эти произвольные номера имели значительное вли я
ние на оценки тестируемых. Н апример, средние оценки процента А фрикан
ских стран в О рганизации Объединенных Н аций были 25 и 45 для групп,
которые получили 10 и 65 в качестве отправных точек соответственно. Д е
нежные вознаграж дения за точность не уменьш али эффект «привязки».
«П ривязка» происходит не только, когда испытуемым задана отправная
точка, но такж е когда испытуемый основывает свою оценку на результате
некоторого неполного вы числения. Изучение интуитивной числовой оцен
30 ВВЕДЕНИЕ
ки иллю стрирует этот эффект. Две группы студентов средней ш колы оце
нивали, в течение 5 секунд, значение числового вы раж ения, которое было
написано на доске. Одна группа оценивала значение вы раж ения
8х7х6х5х4хЗх2х1,
1х2хЗх4х5х6х7х8.
Предубеж дения в оценке конъю нкт ивны х и дизъю нкт ивны х собы
т ий
В недавнем исследовании Бар-Х иллел (B ar-H illel, 1973) тестируемым дава
ли возможность сделать ставку на одно из двух событий. Использовались
три типа событий: (i) простое событие, к ак, например, вы тягивание красно
го ш ара из м еш ка, содержащ его 50% красны х и 50% белых ш аров; (И) свя
занное событие, к ак , например, вы тянуть красны й ш ар семь раз подряд из
м еш ка (с возвращ ением ш аров), содержащ его 90% красны х ш аров и 10%
белых; и (ш ) несвязанное событие, к ак, например, вы тянуть красны й ш ар,
по крайней мере, 1 раз в семи последовательных попы тках (с возвращ ением
ш аров) из меш ка, содержащ его 10% красны х ш аров и 90% белых. В этой
проблеме, существенное большинство тестируемых предпочло сделать став
ку на связанное событие (вероятность которого - 0.48), а не на простое (веро
ятность которого - 0.50). Испытуемые такж е предпочитал и , ставить скорее
на простое событие, чем на дизъю нктивное, которое имеет вероятность 0.52.
Таким образом, большинство тестируемых сделало ставку на менее вероят
ное событие при обоих сравнениях. Эти реш ения тестируемых иллю стри
руют общий вывод: изучение реш ений в азартны х играх и оценки вероят
ности указы ваю т, что люди имеют тенденцию оценивать слиш ком высоко
вероятность конъю нктивны х событий (Cohen, Chesnick и H ar ап, 1972,24) и
склонны недооценивать вероятность дизъю нктивны х событий. Эти стерео
Принятие решений в условиях неопределенности 31
типы полностью объясняю тся эффектом «привязки». У становленная веро
ятность элементарного события (успех в любой стадии) обеспечивает есте
ственную отправную точку для оценки вероятностей к ак конъю нктивны х,
таки дизъю нктивных событий. Так как «корректировки» от отправной точ
ки обычно недостаточно, заклю чительные оценки остаю тся слиш ком при
ближенными к вероятностям элементарны х событий в обоих случаях. Об
ратите внимание, что полная вероятность конъю нктивны х событий ниж е,
чем вероятность каждого элементарного события, в то время к ак полная
вероятность несвязанного события выш е, чем вероятность каж дого элемен
тарного события. Следствием «привязки» является то, что полная вероят
ность будет завыш ена для конъю нктивны х событий и заниж ена - для дизъ
ю нктивных.
Предубеждения в оценке слож ны х событий особенно существенны в кон
тексте планирования. Успешное заверш ение бизнес-предприятия, напри
мер, разработка нового продукта, обычно носит комплексны й характер:
чтобы предприятие преуспевало, каж дое событие из ряда должно произой
ти. Даж е, если каждое из этих событий весьма вероятно, полная вероятность
успеха может быть довольно низкой, если количество событий большое.
Общая тенденция оценивать слиш ком высоко вероятность конъю нктивных
событий ведет к необоснованному оптимизму в оценке вероятности, что план
будет удачным, или что проект будет закончен вовремя. Наоборот, с дизъ
юнктивными структурами событий обычно сталкиваю тся при оценке рис
ка. Сложная система, такая к ак ядерный реактор или тело человека, повре
дится, если любой из его необходимых компонентов выйдет из строя. Д аж е,
когда вероятность сбоя в каж дом компоненте небольш ая, вероятность отка
за всей системы может быть вы сока, если в нее вовлечено много компонен
тов. И з-за предубеждения «привязки», люди имеют тенденцию недооцени
вать вероятность отказа в слож ны х системах. Таким образом, предубежде
ние привязки мож ет иногда зависеть от структуры события. Структура со
бытия или явления похож ая на цепочку звеньев ведет к переоценке вероят
ности этого события, структура события похож ая на воронку, состоящ ая из
дизъю нктивных звеньев, ведет к недооценке вероятности события.
О бсуж ден и е
В этой части книги рассматривались когнитивные стереотипы, которые воз
никают к ак результат уверенности в эвристиках оценивания. Эти стереоти
пы не характерны для эффектов мотивации, таких к ак принятие желаемо
го за действительное или искаж ения суждений из-за одобрения и порица
ния. Действительно, как уже сообщалось ранее, некоторые серьезные ошиб
ки в оценивании происходили, несмотря на тот факт, что тестируемых по
ощ ряли за точность и вознаграждали за правильные ответы (Kahneman и
Tversky, 1972b, 3; Tversky и K ahneman, 1973,11).
Уверенность в эвристиках и распространенность стереотипов свойствен
на не только обывателям. Опытные исследователи такж е склонны к тем ж е
самым предубеждениям - когда они думают интуитивно. Например, тен
денция предсказывать результат, который наиболее репрезентативен по от
ношению к данным, без достаточного внимания к априорной вероятности
наступления такого результата, наблюдались в интуитивных суждениях
людей, которые обладали обширными познаниями в статистике (Kahneman
34 ВВЕДЕНИЕ
и Tversky, 1973,4; Tversky и Kahneman, 1971,2). Хотя те, кто имеют позна
ния в статистике и избегают элементарных ошибок, как, например, ошиб
ки игрока в казино, в интуитивных суждениях для более запутанных и ме
нее понятных задач делают подобные ошибки.
Не удивительно, что полезные разновидности эвристики, такие как реп
резентативность и доступность сохраняются, даже при том, что они иногда
ведут к ошибкам в прогнозах или оценках. Что возможно и является удиви
тельным, так это неспособность людей вывести из длительного жизненного
опыта такие фундаментальные статистические правила к а к регресс к сред
нему или эффект размера выборки при анализе изменчивости внутри вы
борки. Х отя все мы в течение ж изни встречаемся с многочисленными ситу
ациям и, к которым эти правила могут быть применимы, очень немногие
самостоятельно открывают принципы отбора выборки и регресса на своем
опыте. Статистические принципы не познаются на основе каждодневного
опыта, потому что соответствующие примеры не закодированы нужным
образом. Например, люди не обнаруживают, что средняя длина слова в стро
ках следующих друг за другом в тексте, отличается больше чем на следую
щ их друг за другом страницах, потому что они просто не обращают внима
ния на среднюю длину слова в отдельных строках или страницах. Таким
образом, люди не изучают отношение между размером выборки и изменчи
востью внутри выборки, хотя данных для такого вывода предостаточно.
Недостаток соответствующей кодировки такж е объясняет, почему люди
обычно не обнаруживают стереотипы в своих суж дениях о вероятности.
Человек мог бы узнать, правильны ли его оценки, подсчитывая число собы
тий, которые действительно происходят из тех, которые он считает равно
вероятными. Однако для людей не естественно группировать события по
признаку их вероятности. При отсутствии такой группировки человек не
может обнаружить, например, что только 50% предсказаний, вероятность
которых он оценил к ак 0.9 или выше фактически сбылись.
Эмпирический анализ когнитивных стереотипов имеет значение для тео
ретической и прикладной роли оценки вероятностей. Современная теория
принятия решений (de F inetti, 1968; Savage, 1954) рассматривает субъек
тивную вероятность к ак количественное мнение идеализированного чело
века. Определенно, субъективная вероятность данного события определя
ется набором шансов относительно этого события, из которых человеку пред
лагается выбрать. Может быть получено внутренне последовательное или
целостное измерение субъективной вероятности, если выборы человека сре
ди предложенных шансов подчиняются некоторым принципам, то есть а к
сиомам теории. Полученная вероятность субъективна в том смысле, что
различные люди могут иметь различные оценки вероятности одного и того
ж е события. Главный вклад этого подхода состоит в том, что он обеспечива
ет строгую субъективную интерпретацию вероятности, которая является
применимой к уникальным событиям и является частью общей теории ра
ционального принятия решений.
Принятие решений в условиях неопределенности 35
Возможно, стоит отметить, что, в то время к ак субъективные вероятнос
ти могут иногда выводиться из выбора шансов, они обычно не формируют
ся этим способом. Человек делает ставку скорее на команду А, чем на ко
манду В, потому что верит, что команда А, вероятнее всего, победит; он не
выводит свое мнение к ак результат предпочтений тех или иных шансов.
Таким образом, в действительности, субъективные вероятности определя
ют предпочтения в шансах, но не выводятся из них, в отличие от аксиома
тической теории рационального принятия решений (Savage, 1954).
Субъективный характер вероятности привел многих ученых к мнению,
что целостность, или внутренняя последовательность - единственный име
ющий силу критерий, в соответствии с которым должны быть оценены ве
роятности. С точки зрения формальной теории субъективной вероятности,
любой набор внутренне последовательных вероятностных оценок столь ж е
хорош к а к любой другой. Этот критерий не вполне удовлетворителен, пото
му что внутренне последовательный набор субъективных вероятностей мо
ж ет быть несовместим с другими мнениями, которых придерживается че
ловек. Рассмотрите человека, чьи субъективные вероятности для всех воз
можных результатов подбрасывания монеты отражают ошибку игрока в
казино. То есть его оценка вероятности появления «решки» при каждом
конкретном подбрасывании увеличивается с числом последовательно вы
павш их «орлов», которые предшествовали этому подбрасыванию. Сужде
ния такого человека могут быть внутренне последовательными и поэтому
приемлемыми к а к адекватные субъективные вероятности согласно крите
рию формальной теории. Эти вероятности, однако, являю тся несовмести
мыми с общепринятым мнением, что у монеты “нет пам яти” и поэтому она
не способна производить последовательные зависимости. Чтобы оцененные
вероятности, считались адекватными, или рациональными, внутренней
последовательности недостаточно. Суждения должны быть совместимы со
всеми прочими взглядами этого человека. К сожалению, не может быть про
стой формальной процедуры для оценки совместимости набора вероятност
ных оценок с полной системой взглядов субъекта. Рациональный эксперт
будет, однако, бороться за совместимость, даже при том, что внутреннюю
последовательность более легко достичь и оценить. В частности он будет
пытаться делать свои вероятностные суждения совместимыми с его знани
ями относительно предмета, законов вероятности и своей собственной эври
стики оценки и предубеждений.
Резюме
Эта статья описывает три типа эвристики, которые используются при оцен
ках в условиях неопределенности: (i) репрезентативность, которая обычно
используется, когда людей просят оценить вероятность того, что объект А
или случай принадлежит классу или процессу В; (ii) доступность событий
или сценариев, которая часто используется, когда людей просят оценить
частоту класса или правдоподобия отдельно взятого варианта развития со
бытий; и (Ш) корректировка или «привязка», которая обычно использует
ся при количественном прогнозировании, когда доступна соответствующая
величина. Эти эвристики высоко экономичны и обычно эффективны, но они
приводят к систематическим ошибкам в прогнозе. Лучшее понимание этих
эвристик и отклонений, к которым они приводят, могло внести вклад в оцен
ку и принятие решений в условиях неопределенности.
Часть II
Репрезентативность
2. Вера в закон малых чисел*
распределение подтверждает нулевую гипотезу, как это часто бывает, следующая вероят
ность будет даже меньшей.
Данная глава первоначально появилась в Психологическом Бюллетене, 1971, 2,105 -110.
Авторское право © 1971 Американской Психологической Ассоциацией. Переиздано в соот
ветствии с разрешением.
Вера в закон малых чисел 41
Средний IQ среди восьмиклассников в городе, как известно, является 100. Вы выбрали
случайную выборку из 50 детей для изучения достижений в учебе. Первый протестиро
ванный ребенок имеет IQ 150. Каким, как Вы ожидаете, будет средний показатель ин
теллекта для всей выборки?
2В. Эдвардз (1968,25) обосновал, что люди терпят неудачу в извлечении достаточного коли
чества информации или определенности из вероятностных данных. Он назвал эту неудачу
консерватизмом. Наши респонденты вполне подходят под описание консерваторов. Ско
рее, в соответствии с гипотезой репрезентативности, они имеют тенденцию извлекать из
данных большее количество определенности, чем данные, фактически, содержат.
Вера в закон малых чисел 47
Не было фактически никаких различий между среднестатистическими от
ветами в аудитории на собрании, где обсуждались проблемы математичес
кой психологии и на общей сессии съезда Американской Психологической
Ассоциации, хотя мы не заявляем о репрезентативности любой из этих двух
выборок. Очевидно, познания в области формальной логики и теории веро
ятности не уменьшают ошибочную интуицию. Что же, в таком случае, мож
но сделать? Можно ли искоренить веру в закон малых чисел или, по край
ней мере, контролировать ее?
Опыт исследований, вряд ли, сильно поможет, потому что дисперсия
выборок такж е легко «объясняется». Корректирующие эксперименты - это
эксперименты, которые не обеспечивают ни мотива, ни возможности для
ложного объяснения. Таким образом, студент, изучающий статистику, мо
жет брать повторяемые выборки заданного размера из совокупности, и изу
чать влияние размера выборки на изменчивость выборки на личном опыте.
Однако нет уверенности, что ож идания могут быть скорректированы таким
способом, так как предубеждения, подобные таким, к а к ошибки игрока в
казино, сохраняются несмотря на опыт.
Даже если нельзя отказаться от стереотипов, студенты могут научиться
распознавать их существование и принимать необходимые меры предосто
рожности. Так к ак в обучении статистике немало предостережений, пре
дупреждение относительно стереотипности статистической интуиции не
может быть неуместным. Очевидная ъ-ера предосторожности это вычисле
ние. Сторонник закона малых чисел имеет ошибочные убеждения относи
тельно уровня достоверности, мощности и интервалов доверительности.
Уровни значимости обычно вычисляются, и о них сообщается, а мощность
и интервалы доверительности - нет. Возможно, они должны быть.
Явное вычисление мощности, относящееся к некоторой обоснованной
гипотезе, например, малым, большим и средним результатам Дж.Коена (1962,
1969), несомненно, должно быть выполнено до того, к а к проведено исследо
вание. Такие вычисления ведут к осознанию того, что нет никакого смысла
проводить исследование, если, например, размер выборки не увеличить в 4
раза. Мы отказываемся от убеждения, что серьезный исследователь созна
тельно пойдет на риск 0.50 того, что его обоснованная гипотеза исследова
ния так и не будет подтверждена. Кроме того, вычисление надежности су
щественны для интерпретации отрицательных результатов, то есть, если
не удалось отказаться от нулевой гипотезы. Поскольку интуитивные оцен
ки мощности читателями, вероятно, будут неправильными, то, что в дан
ной книге приводятся подсчитанные значения величин, скорее всего, не
будет пустой тратой времени читателей и бумаги.
В психологической литературе, изданной ранее, преобладало согласие при
представлении отчетов, брать, например, выборку размером в среднем, на
пример, М ±РЕ, где РЕ - вероятная ошибка (то есть, доверительный интер
вал 50% относительно средней величины). Это соглашение было позже ос
тавлено в пользу формулировки проверки гипотез. Доверительный интер
вал, однако, обеспечивает полезный коэффициент для дисперсии выборки,
и именно эту дисперсию мы имеем тенденцию недооценивать. А кцент на
уровнях значимости имеет тенденцию уменьшать фундаментальное разли
чие между размером результата и его статистической значимостью. Н еза
висимо от размера выборки, результат в одном исследовании является обо
снованной оценкой результата при повторении. Напротив, оцененный уро
вень значимости в повторном эксперименте сильно зависит от размера вы
борки. Нереалистичные ожидания относительно воспроизводимости уров
ней значимости могут быть скорректированы, если будет прояснено разли
чие между размером и значимостью, и если вычисленный размер наблюда
емых результатов описан к а к положено. С этой точки зрения, по крайней
мере, принятие модели проверки гипотез не было долгожданным счастьем
для психологии.
Ревностный приверженец закона малых чисел совершает множество гре
хов против логики статистического вывода с самыми честными намерения
ми. Гипотеза репрезентативности описывает когнитивный стереотип или
стереотип чувственного восприятия, который действует независимо от мо
тивации. Таким образом, в то время к ак поспешный отказ от использова
н и я нулевой гипотезы является привлекательным, отклонение от взлеле
янной гипотезы, является ухудшающим, все ж е истинный сторонник зако
на малых чисел зависит и от того, и от другого. Его интуитивные ожидания
подчиняются скорее постоянному неправильному восприятию мира, чем
удобному принятию желаемого за действительное. В ответ на замечания ре
дакторов, он может решить относиться с надлежащим недоверием к своей ста
тистической интуиции и заменять впечатления вычислением всякий раз, ког
да это возможно.
3. Субъективная вероятность:
оценка репрезентативности*
Отражение случайност и
Д ля того чтобы неопределенное событие было репрезентативным, не доста
точно, чтобы оно было подобно своей исходной совокупности. Событие так
ж е должно отражать свойства неопределенного процесса, породившего его,
то есть оно должно казаться случайным. К ак и в случае с подобием выборки
Субъективная вероятность 53
и совокупности, специфические особенности, которые определяют очевид
ную случайность, различаются в зависимости от контекста. Несмотря на
это, две общих особенности, беспорядочность и локальная репрезентатив
ность, каж ется, захватывают интуитивное представление о случайности.
Обсудим эти свойства по порядку.
Главная характеристика очевидной случайности - отсутствие системати
ческих образцов. Последовательность выпадений монеты2, например, кото
рая очевидно упорядочена - не репрезентативна. Таким образом, чередую
щиеся последовательности орлов и решек, как, например, ОРОРОРОР или
РРООРРОО, не смогут отразить случайность процесса. Действительно, испы
туемые считают такие последовательности относительно невероятными и
избегают их в моделировании случайных последовательностей (Time, 1964;
W agenaar, 1970).
Ожидается некоторая неупорядоченность, не только в появлении резуль
татов, но такж е и в их распределении, к а к показано в следующей задаче:
В каждом туре игры, 20 шариков наугад распределяются среди пятерых детей:
Аланом, Беном, Карлом, Дэном и Эдом.
Рассмотрите следующие распределения шариков:
1. Алан — 4, Бен — 4, Карл — 5, Дэн — 4, Эд — 3.
2. Алан — 4, Бен — 4, Карл — 4, Дэн — 4, Эд — 4.
Если устроить несколько туров игры, какого типа результаты встретятся больше - пер
вого или второго типа?
Распределение вы борок
Мы предположили, что испытуемые оценивают вероятность события таким
образом, чтобы более репрезентативным событиям приписывать более высо
кие вероятности, а одинаково репрезентативным событиям - равные вероят
ности. В этом параграфе мы исследуем значение этой гипотезы для изучения
субъективных распределений выборок, то есть, вероятность того, что испы
туемые возьмут выборки данного размера из указанной совокупности.
Когда выборка описана в терминах единичной статистики, например,
пропорции или среднего, то степень, в которой она репрезентативна сово
купности, определяется подобием этой статистики соответствующему па
раметру совокупности. Так к ак размер выборки не отражает никакой спе
цифической особенности исходной совокупности, он не ассоциируется с реп
резентативностью. Таким образом, событие, в котором обнаруживается боль
ше чем 600 мальчиков в выборке из 1. 000 младенцев, например, столь ж е
репрезентативно, к ак обнаружение больше чем 60 мальчиков в выборке из
100 младенцев. Поэтому, два эти события, были бы оценены к ак равноверо
ятные, хотя последнее, на самом деле, значительно более вероятно. Точно
так ж е согласно данному анализу, субъективная вероятность того, что сред
ний рост в выборке людей — между 6 футами 0 дюймами и 6 футов 2 дюйма
ми будет независима от размера выборки.
Чтобы проверять эти прогнозы, девять различных групп испытуемых
воспроизвели субъективные распределения выборок для трех размеров вы
борки (N = 1 0 ,1 0 0 ,1 . 000) и для каждой из следующих трех совокупностей.
Распределение полов. (Биномиальное, р = 0.50) Испытуемым сказали, что
каж ды й день рождается приблизительно N младенцев в определенном ре
гионе. Д ля N = 1. 000, например, вопрос, звучал так:
Каков процент дней, в которые число мальчиков среди 1.000 младенцев будет следую
щим:
До 50 мальчиков
от 50 до 150 мальчиков
от 150 до 250 мальчиков
5 0.16
* 0.14
о 0.12
S 0.10
| 0.08
® 0.06
CL
и 0.04
0.02
vP
о4*
ID
vO
O '"
ID ID
nP
ID
\P
ID
nP
in
sO
o4
ID ID
s?
ID
sp
О
CM CO ID <o r*» OO
1
CT> О
ID ID in in in ID ID ID ID V
CM CO in C- OO ID
O)
Категории
Категории
Рис. 2. Распределение типов сердцебиения
рали каждую категорию ответа, для каждой из двух форм. Правильные от
веты помечены звездочками.
1. Некий город обслуживается двумя больницами. В большей больнице каждый день
рождается приблизительно 45 младенцев, а в меньшей больнице каждый день рожда
ется приблизительно 15 младенцев. Как Вы знаете, приблизительно 50% всех младен
цев - мальчики. Точный процент мальчиков-младенцев, однако, изменяется со дня на
день. Иногда он может быть выше, чем 50%, иногда понижаться.
В течение 1 года каждая больница вела учет дней, в которые (больше / меньше) чем
60% рожденных младенцев были мальчики. Какая больница, как Вы думаете, сделала
учет большего количества таких дней?
Больше в Меньше в
П р о гн о зи р о в а н и е к а т е г о р и и
Среднее
Средняя Средняя
Специализация аспирант а базовое
величина величина
значение
подобия вероят ност и
(в %)
Управление бизнесом 15 3.9 4.3
Программирование/
информатика 7 2.1 2.5
Технические науки 9 2.9 2.6
Гуманитарные науки и
педагогика 20 7.2 7.6
Юриспруденция 9 5.9 5.2
Библиотекарское дело 3 4.2 4.7
Медицина 8 5.9 5.8
Физика и естественные
науки 12 4.5 4.3
Социальные науки 17 8.2 8.0
2 При вычислении этой корреляции, оценки были инвертированы таким образом, чтобы
высоко оцененной вероятности соответствовало высокое значение.
70 РЕПРЕЗЕНТАТИВНОСТЬ
основе репрезентативности, то есть они прогнозировали исходы по их подо
бию дополнительной информации, не принимая во внимание априорную
вероятность.
Испытуемые в группе прогнозирования целиком полагались на краткое
описание личности, и, очевидно, не принимали во внимание следующие со
ображения. Во-первых, учитывая известную неадекватность проективного
тестирования личности, вполне вероятно, что Том В. действительно не стра
дал навязчивыми стремлениями и не был таким равнодушным, как пред
полагает его описание. Во-вторых, даже если описание соответствовало дей
ствительности, когда Том В. был учащ имся средней ш колы, оно могло стать
ложным при поступлении в аспирантуру. Наконец, даже если описание все-
таки достоверно, очевидно, что под него подходит больше студентов, изуча
ющ их гуманитарные науки и педагогику, чем студентов, изучающих ин
форматику, просто потому что в первой области студентов намного больше,
чем в последней.
М а н и п у л я ц и я ожидаемой точностью
Гипотезой проведенного нами дополнительного исследования являлось то,
что вопреки статистической модели, манипуляция ожидаемой точностью
не затрагивает структуру прогнозов. Экспериментальный материал состо
ял из пяти кратких описаний личности мальчиков-девятиклассников, пред
положительно составленных консультантом-психологом на основе интер
вью к ак части лонгитюдного исследования. Описания были построены так
ж е, к ак и в исследовании с Томом В. Д ля каждого описания, испытуемые
первой группы (N - 69) рассмотрели девять областей специализации аспи
рантов (см. Таблицу 1) относительно соответствия отдельно взятого маль
чика “образу типичного аспиранта-первокурсника в данной области”. Опи
раясь на суждения подобия, они оценили частоту базового значения девяти
областей специализации аспирантов. Результаты представлены в Таблице 1.
Оставшимся испытуемым сообщили, что эти описания были наугад отобра
ны из числа участников первоначального исследования, которые теперь
являю тся аспирантами-первокурсниками. Группе с высокой точностью
(N = 55), указали, что “на основе данных описаний, испытуемые студенты
делают правильные прогнозы приблизительно в 55% случаев”. Группе с низ
кой точностью (N = 50) сообщили, что предсказания студентов правильны
приблизительно в 27% случаев. Д ля каждого описания, испытуемые оце
нили эти девять областей согласно “вероятности того, что данный человек
является на данный момент аспирантом в этой области”. Они такж е опреде
лили вероятность правильности первого выбора для каждого описания.
М анипуляция ожидаемой точностью имела существенное влияние на суж
дения о вероятности. Средние оценки были 0.70 и 0.56, для группы с высокой
и с низкой точностью соответственно (t = 3.72, р < 0.001). Однако, распреде
ление девяти исходов, полученных после инструкции о низкой точности, были
О психологии прогнозирования 71
незначительно ближе к распределению базового значения, чем распределе
ние, полученное после инструкции о высокой точности. Для каждого испы
туемого было вычислено произведение моментов между средней величиной,
которую он предписал каждому из этих девяти исходов (по этим пяти описа
ниям) и базовым значением. С помощью этой корреляции можно измерить
степень, в которой прогнозы испытуемого соответствуют распределению ба
зового значения. Среднее значение индивидуальных корреляций равнялось
0.13 для испытуемых в группе с высокой точностью и 0.1 б для испытуемых в
группе с низкой точностью. Эта разница не является значимой (t = 0.42, d f =
103). Данный пример суждения нарушает нормативную теорию прогнозиро
вания, согласно которой любое уменьшение ожидаемой точности должно со
провождаться изменением предсказаний в сторону базового значения.
Так к а к м анипуляция ожидаемой точностью не оказала влияния на про
гнозы, две группы прогнозов были объединены. Последующие исследова
ния были проведены тем ж е образом, что и в исследовании с Томом В. Для
каждого описания, было вычислено две корреляции: (а) между средней ве
личиной вероятности и средней величиной подобия и (Ь) между средним
значением вероятности и средней величиной базового значения. Корреля
ции отражены в Таблице 2, с учетом исхода, оцененного к а к наиболее веро
ятный для каждого описания. Высокие значения корреляции были полу
чены между прогнозом и подобием. И наоборот, не обнаружено системати
ческой связи между базовым значением и прогнозом: значения корреляции
широко изменялись в зависимости от того, являю тся ли наиболее репрезен
тативные исходы для каждого описания частыми или редкими.
Это описание было построено таким образом, чтобы быть полностью неин
формативным в отношении профессии Дика. Испытуемые обеих групп при
шли к согласию: средние оценки составили 50% (см. Рисунок 1). Разница
между ответами на это описание и на “пустое” описание разъясняет ситуа
цию. Очевидно, люди реагируют по-разному, когда не получают никакого
описания, и когда дано бесполезное описание. В первом случае, априорная
вероятность принимается во внимание; во втором, априорная вероятность
игнорируется.3
Существуют ситуации, когда априорная вероятность, играет более суще
ственную роль. Во всех примерах, рассмотренных до настоящего момента,
четко выраженные стереотипы были связаны с альтернативными исходами,
и, мы предполагаем, что суждения управлялись, степенью, в которой описа
ния оказывались репрезентативными по отношению к этим стереотипам. В
других задачах исходы естественно рассматривать как части измерения. Пред
положим, например, что Вас попросили оценить вероятность того, что к аж
дый из нескольких студентов получит стипендию. В этой задаче, не существует
хорошо обозначенных стереотипов студентов, которые получают или не по
лучают стипендию. Скорее, естественно рассматривать исход (то есть, полу
чение стипендии) как некий отрезок на прямой академических достижений
или способностей. Априорная вероятность, то есть процент стипендий в опре
деленной группе, могла использоваться, чтобы устранить пределы. Следова
тельно, они, вряд ли игнорируются. Кроме того, мы могли бы ожидать, что
экстремальные априорные вероятности будут оказывать некоторое воздей
ствие даже при наличии четких стереотипов исходов. Точная схема условий,
при которых первичная информация используется или отвергается, требует
дальнейшего исследования.
Один из основных принципов статистического прогнозирования гласит,
что априорная вероятность, которая суммирует наши знания относительно
проблемы до того, к ак мы получили определенное описание, остается умест
ной даже после того, как такое описание получено. Правило Байеса перево
дит этот качественный принцип в мультипликативное соотношение между
3 ноем с. 185
76 РЕПРЕЗЕНТАТИВНОСТЬ
априорной вероятностью и отношением вероятности. Нашим испытуемым
не удалось объединить априорную вероятность и дополнительную информа
цию. Когда им было предоставлено описание, каким бы неинформативным
или недостоверным оно ни было, Тома В. или Д ика (инженер/адвокат), ис
пытуемые, очевидно, чувствовали, что распределение профессий в его груп
пе больше не соответствовало действительности. Неспособность оценить роль
априорной вероятности, если дано определенное описание - это, возможно,
одно из наиболее существенных отклонений интуиции от нормативной тео
рии прогнозирования.
Оценка Оценка
Г руппа
1. 1и 2 2. 2 и3 3.
Среднегодо Умст вен Чувство
Статистика вая оценка ная ю мора
в процен концент ра
тиле ция
Средняя
спрогнозиро
Не 2.46
ванная 2.27 значимо 2.35 0.05
среднегодо
вая оценка
Ст андарт ное
0.91 Не 0.01 0.69
отклонение 0.87
прогнозов значимо
Отклонение
0.030 Не 0.029 0.01 0.022
регрессии значимо
Не Не 0.94
Корреляция г 0.97 0.95 значимо
значимо
4 Ожидание того, что каждый значимый акт поведения высоко репрезентативен по отноше
нию к исполнителю, может объяснить, почему как обыватели, так и психологи постоянно
удивляются незначительным корреляциям среди, как кажется, взаимозаменяемых изме
рений честности, рискованности, агрессии и зависимости (Mischei, 1968).
О психологии прогнозирования 87
Чтобы проиллюстрировать постоянство нерегрессивной интуиции, не
смотря на то, что она подчиняется статистике, мы представили следующую
проблему нашей выборке аспирантов, специализирующихся в психологии:
Проблема тестирования. Человек, выбранный наугад, обладает коэффициентом интел
лекта, равным 140. Предположим, что коэффициент интеллекта представляет собой
сумму “истинного” количества очков и случайную ошибку измерения.
Майя Бар-Хиллер
L М R
П одоби е и в е р о я т н о с т ь
Вскоре после того, к ак было введено понятие репрезентативности, я прове
ла небольшое исследование, в котором репрезентативность оценивалась, как
в соответствии с априорными критериями (что будет разъяснено позже в
этой главе), так и экспериментально, в соответствии с оценками испытуе
мых. Затем я сравнила эти оценки с независимо собранными суждениями о
вероятности (Bar-Hillel, 1974). Преимуществом изучаемых задач являлась
их уникальность, четко определенная вероятность, а такж е простота визу
ального представления, позволяющая легко делать суждения о видимом по
добии.
В качестве стимулов в этом исследовании были выбраны тройки гистог
рамм, обозначенные L, М и R для левой, средней и правой гистограммы,
соответственно. Пример приведен на Рисунке 1. К аж дая диаграмма состо
ит из трех полос, которые окрашены, слева направо, в зеленый, ж елты й и
красны й цвет. В длину каж дая полоса поделена на 5 частей, а длины этих
трех полос в пределах каждой гистограммы, в сумме составляют 100.
Все тройки гистограмм (L, М, R), используемые в этом эксперименте об
ладали следующими свойствами:
1. Каждая полоса в средней гистограмме является средней по длине между
соответствующими полосами в гистограммах слева и справа (однако если,
средняя длина левой и правой полос не достигала числа, кратного пяти, сред
н яя полоса округлялась к ближайшему числу, кратному пяти.) Например,
на Рисунке 1, длина зеленой полосы в М-гистограмме = 35, что находится
между 20 и 50 (соответствующие длины полос в L и R гистограммах). То ж е
можно сказать про ж елтые и красные полосы. (Обратите внимание, однако,
что длины этих полос округлены: от 42.5 до 40 и от 22.5 до 25.)
Изучение репрезентативности 91
2. Порядок длин полос в М-гистограмме совпадает с порядком или в L-
или в R -гистограмме, но не с двумя, так к ак L- и R -гистограмма всегда упо
рядочены по-разному. Например, на Рисунке 1 порядок М и L один и тот
же, причем красная полоса - самая короткая, а ж елтая - самая высокая в
обеих диаграммах, что отличается от порядка в R диаграмме, где ж елтая по
лоса самая короткая. Это подчеркивается тонкой линией, соединяющей вер
шины всех полос в гистограмме, хотя ось X была номинальной переменной.
3. Предположим, что М-гистограмма интерпретируется как описание три
номиальной совокупности, a L и R -гистограммы интерпретируются как вы
борки из 20 субъектов, которые выбраны из этой популяции. Тогда выборка,
чей порядок совпадает с порядком М-гистограммы, является менее вероятной
выборкой. Например, на Рисунке 1, М описывает триномиальную совокупность
с параметрами 0.35, 0.40, и 0.025. Вероятность того, что взята выборка R (то
есть, 10 зеленых, 3 желтых и 7 красных бусинок), а не выборка L (то есть, 4
зеленых, 14 желтых и 2 красные бусинки) - приблизительно 8 к 5, т. к.
А В
L R
П одобие 2 15
П одобие £ |— Д — “[“ о*— j
10 1
Вероятность выборки Вероятность совокупности
0 = 0.79 0 = 0.75
З а с ч е т к а к и х особен н остей в ы б о р к и в о с п р и н и м а ю т с я р е п р е з е н
тативны м и?
Олсон (Olson, 197б) указал, что, хотя “понятие суждения, основанное на оцен
ке репрезентативности, подтверждается в значительной степени, к ак экс
периментально, так и интроспективно, в большом количестве ситуаций”,
этого недостаточно, если мы не можем определить “факторы, которые дела
ют свойства определенной задачи или проблемы существенными на столько,
чтобы относительно них оценивать репрезентативность” (с. 608). В некото
рых контекстах, таких к ак исследование подобия и вероятности, они были
идентифицированы. В качестве еще одного примера, оказывается, что ключ,
определяющий репрезентативность вт тборки для неупорядоченных выбо
рок различного размера, взяты х из некоторого распределения Бернулли,
не соответствует пропорции “успехов” в выборке и соответствующему пара
метру совокупности (Kaheman и Tversky, 1972b, 3). Исследование, которое
я сейчас опишу (Bar-Hillel, 1980b), предлагает общую методологию для
идентификации особенностей выборок из любой популяции, определяю
щ их репрезентативность. Это можно пояснить на примере попытки иден
тифицировать признаки, которые определяют репрезентативность выборок
(трех наблюдений) взяты х из функции распределения (например, нормаль
ного), по форме напоминающей колокол.
Основной принцип прост: если мы предполагаем, что суждения репрезен
тативности и вероятности определены в соответствии с одними и теми ж е су
щественными свойствами, то эти свойства могут быть обнаружены, за счет
опроса, в котором испытуемым предлагается определить вероятности для не
которого набора выборок. Эта процедура меняет роли вероятности и репре
зентативности. Другими словами, оценки вероятности используются не для
того, чтобы подтвердить репрезентативность, а чтобы ее вывести. Однако если
попросить испытуемых оценить выборки непосредственно на основе репре
зентативности, то это может рассматриваться как спорный вопрос. Они мо
гут возразить: “Что Вы подразумеваете под репрезентативностью?” Вместо
этого, предложенная стратегия заменяет собой ясный, однозначный вопрос
(“К акая из этих выборок, более вероятно, взята наугад из этой совокупнос
ти?”), который, согласно стандартным посылкам, имеет нормативный ответ.
94 РЕПРЕЗЕНТАТИВНОСТЬ
Испытуемым предложили подобную задачу:
Средний рост студентов американских колледжей -175 см. Из офиса секретаря коллед
ж а были наугад взяты три файла, принадлежащие Джону, Майку и Бобу. Какой ре
зультат является более вероятным для роста трех молодых людей?
Д ж о н -1 7 8 см М а й к -1 7 0 см
Б о б -1 7 6 см
или
Джон - 177 см Майк - 177 см Боб - 177 см
Ф актические данные отличались в различных документах и их можно
найти в колонках стимулов Таблицы 1 (вышеупомянутый пример соответ
ствует строке 1). Систематически изменяя используемые числа, можно было
проверить только то, какие особенности выборок, и в каком порядке, опре
деляли ответы испытуемых. Прежде, чем я предложу вашему вниманию
обобщенную картину, вот несколько пояснений чтобы, помочь читателю
понять таблицу.
1. Выборка обозначалась как А всегда, когда она воспринималась как
более вероятная, чем выборка, с которой она ш ла в паре. В первоначальных
формах вопросника, выборки А появлялись справа так ж е часто, к а к и сле
ва. Точная пропорция испытуемых, которые выбрали А, а не В, приведена в
колонках ответов.
2. Выборку, которая является более вероятной с нормативной точки зре
н ия, можно увидеть в колонке статистических измерений. Выборка А бо
лее вероятна, чем выборка В тогда и только тогда, когда Р (А) /Р (В) > 1, то
есть, когда
/(* ■ )« /(* ,) * / ( * ^
f W * f ( Y 2) * f ( Y 3)
где А = [Xj, Х 2, Х 3], В = [Yj, Y3, Y3]. Это отношение было вычислено для
ф ункции с нормальной плотностью при (л= 175 см, сг=6 см. Так к а к статис
тически правильный ответ появляется в столбцах А и В одинаково часто,
ответы испытуемых четко связаны с этим не более, чем на случайном уров
не.
Возможно наиболее поразительная особенность результатов, сведенных
в Таблице 1 - тот ф акт, что не существует никакого признака, на который
полагаются испытуемые, упорядочивая выборки. Например, иногда они
отбирают выборку, среднее значение которой ближе к среднему значению
совокупности (например, строка 1), а иногда они выбирают совершенно про
тивоположное (например, строка 2). Иногда испытуемые отбирают выбор
ку, содержащую более крайние наблюдения (например, строка 13), а иног
да напротив (например, строка 14). Действительно, каж ется, что набор при
знаков является важным и рассматривается некоторым последовательным
способом, к ак изображено на Рисунке 3 (количество идентичных наблюде-
о
о
§о
S
О
EH
ф
ф
к
ф
ф
ю
со
О
аcd
К
А
S3
S3
5И
И
W
W
Я 5
cd й
JS л
Ei n
а о
JT
ьcd ©
©
оа оо
S'g
sI
2гН мw '
Д ft
МЯ
я р.
Статистика
Ответы Колмого
Стимулы для рова-Смир
Стимулы для выборки А Правиль нова
выборки В
ные ответы
ш
к
<
т
т
4/
:
>—
ЖШ
§
ДЖОН 1 Майк Боб Джон Майк
Три различия
о
0)
ю
ю
00
00
против трех
со
176
со
чН
гЧ
1
1—
СО
сходств
181 165 177 175 175 175 6.42 0.50
О 6
СМ со
178 170 176
СО со
ь- со ю
178 180 176 175 175 175 1.59 0.57 0 .5 0 #
178 180 176 177 177 177 1.39 0.57 0.63
00
О) о со ю ю
ю со
со
гН осм 00
191 189 175
с& О) 00 00 1>
175 175 1300
со 1> ю о см
см
см со см см см
гЧ
0.91 0 .5 0 #
т п т т PQ
Три различия
о
00
г>
против двух 178 170 176
1>
176 170
со
176 1.12
см
см
см
0.31
PQ
сходств
178 [ 170 176 178 170 178 0.68 0.31 0.36
СМ
6
◄ <
00 os
со ь-
Tt« со
176
со
со
00
со
178 170
со
гЧ
огЧ гН
гЧ
СО
гЧ см
177 1.14 0.31 0.31
о
6
т п я
О) со со
гЧ со
1Л so
1.14
гЧ
СО
СО
Изучение репрезентативности
Предпочтителен
о
*
<
ЯГО
О
со
т*Ч гЧ ю
с
ч-Ч со
ю О> os гН 00 00 со о ю
СМ со
1—
< <
1> со ю
1> Tt« О)
1 гЧ
О см см
0 .1 7 #
СО со гЧ
95
96 РЕПРЕЗЕНТАТИВНОСТЬ
It-
х хь- t-
х X t—t-
1t- X X ь-
X X ь- ь- X
X X ь-It-
d о о о о о о о о о d
тЧ
СО гЧ
X t-
оо тЧ00 ь- оо оо X о X t-
X о X ь-
X
О О о о о о о о о о о
S5|s} я *и
l ч д ◄◄д ◄ < с
^а g
gl на <
я« к «
о
о
о
о
X
см о
смд t—
X гЧ X X X
X см X
It-
X X
X
тН тЧ о о о тЧ о 6 о о
ь-
X хсм хсм схм о X ь- о lt-
со см со X X X X
X
ссм
м ссо t- ь-
о см со см стЧм тЧX X д тЧод
тЧ о
0
t-0 со X 0
t- со оо X ь- X тЧ тЧ
X0 ь- X ь- X X X X
t- сь-о сXм X
t- см X
X t- X XX X
X X
X X
It- X
тЧ гЧ тЧ тЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ
о
t—
тЧ
X
тЧ
t- X X о
о X о t-
X Xо X X X од
тЧ тЧ тЧ тЧ тЧ
t-
тЧ
t-
тЧ тЧ тЧ
It- It-
сt-м X X X
t- t- X X X тЧX тЧX X
It-
тЧ
XIt-
тЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ
со
t— сt— X t—X
о t- X X t- lt-
t- ь- t- fc- X X
It-
lt-
It- It-
14 гЧ тЧ гЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ
о
t-
тЧ
о
гЧ
о
t— t- гЧ
X
X t- тЧt- Т1< тЧX
гЧ тЧ тЧ тЧ
t- X
It-
о о
ь- X X
т 4 тЧ тЧ
00
t— X t-
t- ь- X X
X тЧX X t- It-X XX X XIt- It- It-
гЧ гЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ
X
тЧ
од сом сi4м ссм
гЧ
м с0м
0 см X X ь-
X X X XX
X
я
« и
к
2 Б
-«sм о
О ч
Я О
дай 2п
i| i(Бi 2Я
||
ю3 8 & о i8
WS 5 дя
Рч. и
Изучение репрезентативности 97
ний о том, представлены ли обе стороны среднего значения выборки, сред
нее значение и диапазон). Это усиливает мнение о том, что в независимости
от определения, предполагаемое подобие выборки, составляет собственную
концепцию . Если бы испытуемые использовали единственный признак, не
было бы необходимости назы вать это репрезентативностью. Известно, что
оценки испытуемых, каж ется, основаны на сложных соображениях о струк
туре выборок, представляю щ их основания для вы раж ения (скорее, концеп
туализации) их эвристического суждения на основе репрезентативности.
М ожет ли блок-схема на Рисунке 3 рассматриваться больше, чем просто
удобное и емкое резюме результатов Таблицы 1? Н асколько серьезно мож
но считать ее процессной моделью фактического рассуждения испытуемых
в описанной задаче? С одной стороны, очевидно, что не все особенности мо
дели будут соответствовать - другим выборкам, другим размерам выбо
рок, другим распределениям. Я бы, например, не утверж дала, что любая
выборка с дисперсией будет всегда оценена как более вероятная., чем лю бая
выборка без дисперсии - хотя это и сохраняется для выборок, использован
ных в моем эксперименте. Упорядоченная модель, таким образом, являет
ся только приближением фактической когнитивной стратегии людей. Од
нако, будучи таковой, она обладает весомым психологическим преимущ е
ством, являясь правдоподобной, так к ак она содержит в себе лиш ь малень
кое число простых в вычислительном отношении признаков.
В этом пункте предлагается интересное наблюдение, которое связывает
описанное выш е исследование и настоящ ее. В исследовании гистограмм, два
вида упорядочения по вероятности сравнивались с упорядочением по подо
бию: (а) упорядочение двух выборок по признаку более или менее вероят
ных исходов некоторой совокупности, обозначенной Р (s/p); (b) упорядоче
ние двух совокупностей в качестве более или менее вероятных источников
некоторой выборки, обозначенной P (p/s) (иногда называемое обратными ве
роятностями). Эти две задачи, привели к очень близким результатам, со
гласно которым они обе были сделаны очень похожим образом - действи
тельно, в соответствии с гипотезой, что они были обе реш ены на основе
репрезентативности (то есть, в данном случае, визуального подобия). Суще
ствует статистическая концепция, которая является аналогичной психоло
гической концепции репрезентативности - концепции степени соответствия.
Измерение степени соответствия типично используется в проверке гипоте
зы, когда неизвестна совокупность, породивш ая некоторую известную вы
борку, при отсутствии информации о предполагаемой вероятности. Таким
образом, при оценке совокупностей, репрезентативность, каж ется, более со
ответствует концепции степени соответствия между выборкой и совокуп
ностью, чем концепции вероятности совокупности, условной для некото
рой выборки, Р (p/s).
В исследовании распределения роста, однако, была предложена совокуп
ность, которая являлась источником для выборок. Поэтому, испытуемым
не приходилось оценивать ни обратные вероятности, ни степень соответ-
98 РЕПРЕЗЕНТАТИВНОСТЬ
ни одна обе
7-28
ш ЛL
. А Какая из выборок имеет среднее Ц üw Я»
■ и ------------------- — значение, ближе к \l? ß ^
Ш4
Ü г**1
идентичных наблюдения?
7,8,9
ни одна обе
13-14,16 также
ствия. Однако, интересно, смогут ли их оценки, так или иначе, быть пере
строены в качестве интуитивной попы тки оценить последнее.
Одно из возмож ны х измерений степени соответствия между выборками
из трех элементов и нормальным распределением - одно-выборочная, дву
сторонняя статистика Колмогорова-Смирнова (КС) (см., например, Siegel,
1956, стр. 47-52). Эта статистика интерпретируется так, что чем больше зна
чение (максимальное расстояние между ф ункциями распределения выбор
ки и совокупности), тем менее вероятно, что эта выборка взята наугад из
совокупности. В последних двух столбцах Таблицы 1 приведена статистика
КС для каж дой из исследуемых выборок. В 18 парах, распределение выбо
рок по статистике КС согласовывалось с их распределением большинством
Изучение репрезентативности 99
испытуемых; в 3 парах статистика КС бы ла выровнена (в 1 из которых, стро
ка 12, испытуемые такж е были ф актически единодушны), а в 7 парах (от
меченных в Таблице 1 звездочками) распределения различны .
Это мало влияет на сравнение степени согласованности между распреде
лением КС и распределением, произведенным испытуемыми, со степенью
согласованности между нормативным распределением и распределением
испытуемых (в последнем приш ли к согласию в 13 из 28 стимулов), так как
последние цифры - только побочные продукты отдельно взяты х стимулов,
которые не были наугад отобраны из всех возможных стимулов. Намного
важнее рассмотреть, где модель иерархических особенностей отличается от
модели “степени соответствия”. Случаи, где распределение КС было согла
совано, а распределение испытуемых не было (строки 2 1 ,2 7 , и в небольшой
степени 12) могут быть приписаны значениям КС, вычисленным со стан
дартным отклонением в б см. Это привело к появлению выборки (181,169,
175) (выборка В, строка 17), которая имеет диапазон 12 см, при самом м а
леньком значении КС, когда “идеальны й” (то есть, наиболее репрезентатив
ный) диапазон в оценках испытуемых был несколько меньшим - от 8 до 10 см.
Так к ак мы никак не можем, на основе имеющ ихся данных, установить стан
дартное отклонение субъективного распределения роста, становится непо
нятно, к ак поступить с этим несоответствием.
Другой вид несоответствия, к которому относятся строки 4, б, 9, и с 14-
17, происходит, потому что модель КС, а не иерархическая модель, предус
матривает компенсацию. Другими словами, если некоторая выборка имеет
“недостаток” (как, например, она может состоять из трех идентичны х на
блюдений, или представлять только половину ф ункции совокупности), ис
пытуемые считаю т, что она менее репрезентативна, чем любая выборка без
недостатка, но модель КС рассматривает такж е факторы , которые находят
ся ниж е в иерархической модели. К ак я упомянула выш е, иерархический
характер предложенной модели процесса должен быть расценен как при
ближение, поэтому рассматриваемое несоответствие является скорее несо
ответствием степени, чем вида.
Другие измерения степени соответствия вычислены статистиками. То,
что они не приш ли к согласию, указы вает, что свойство, которое они наме
реваю тся изм ерять, не ясно и не точно определено. Х отя у опытного статис
тика интуиция бсГлее развита, чем у неподготовленного испытуемого, они
оба могут пы таться искать одно и то ж е базовое понятие. До настоящ его вре
мени, даж е усилия статистиков в этом направлении не увенчались большим
успехом.
Р о л ь р а з м е р а в о ц ен к е в ы б о р к и
Некоторые характеристики выборок соответствуют некоторым параметрам
совокупности; эти характеристики называю тся статистикой выборки. К ним
обычно применялась эвристика репрезентативности, когда репрезентатив
100 РЕПРЕЗЕНТАТИВНОСТЬ
ность эквивалентна подобию или приближенности статистики выборки к
соответствующим параметрам популяции. Я назову это первичным смыс
лом репрезентативности. Но выборки могут быть описаны в терминах про
цедуры , посредством которой они такж е были получены. Н апример, выбор
к а мож ет быть осуществлена с возвращ ением или без; из известной сово
купности или неизвестной; и т. д . Возможно, к ним такж е могло прим енять
ся понятие репрезентативности. Таким образом, люди могут (и имеется к у
рьезное свидетельство, что это так) оценивать выборку, взятую наугад, как
менее репрезентативную , чем стратифицированную выборку, или ж е боль
ш ую вы борку, к а к более репрезентативную , чем маленькую (B ar-H illel,
1980b). Я назову это вторичным смыслом репрезентативности. Так к ак это
касается методов осущ ествления выборки, а не последующей статистики
выборок, репрезентативность во вторичном смысле отраж ает ож идания от
носительно репрезентативности в первичном смысле. Другими словами,
чтобы оценить большую выборку к ак более репрезентативную , чем малень
кую , стоит ож идать, что ее “сущ ественные особенности” или “сущ ествен
ные свойства” лучш е отразят “существенные особенности” или “существен
ные свойства” совокупности, до того, к ак будет сказано, каковы они на са
мом деле.
Экспериментальные проблемы, которые я опишу в последней главе, были
посвящ ены рассмотрению вторичного смысла репрезентативности, по от
ношению к размеру выборки.
Проблема 1: Две фирмы, специализирующиеся в изучении общественного мнения, про
водят наблюдение с целью определения пропорции избирателей, намеревающихся про
голосовать положительно на некоем референдуме. Фирма А рассматривает выборку из
4 0 0 человек. Фирма В рассматривает выборку из 1 .0 0 0 человек. В чьей оценке Вы были
бы более уверены?
1 более более
1
более 60% * 100% *
70% ь 80% "
N 50 40 28 27 41
аКанеман и Тверски
ь ранее неопубликованные данные, Бар-Х иллер
сиз Бар-Х иллер (1979). Здесь, больш ая и м аленькая больницы по 15 и 5 м ла
денцев, соответственно
Обсуждение
В этой главе представлены выводы о трех исследованиях оценок субъектив
ной вероятности, которы е рассматриваю т понятие репрезентативности.
Однако каж дое и з них касается его в разной мере.
Первое исследование - это прям ая демонстрация того, что оценки подобия
и вероятности связаны . В отличие от многих других задач, которые проверя
ли эту гипотезу (см., напр., Kanem an & Tversky, 19726,3; 1973,4), в данном
случае испытуемых нельзя обвинить ни в неспособности учитывать другие
соображения (или, хотя бы очевидные или простые), ни в том, что они прида
ют слиш ком большое значение ошибочным или нерелевантным соображени
ям. Кстати, исклю чая подсчет вероятности, которую их просили оценить,
испытуемым ничего не оставалось, к ак использовать ту стратегию, которой
они пользовались. Это иногда уменьшает показательную силу. Если учиты
вать и другие результаты, можно увидеть, насколько непреодолимыми мо
гут быть соображения подобия - даж е простого визуального типа - при оце
нивании сложных событий, путем подсчетов или концептуально.
До исследования характерны х свойств выборок, тесты репрезентативно
сти изначально рассматривали совокупности с одним параметром или при
знаком с одним измерением. Это позволило сформировать непосредствен
ное и априорное оценивание стимулов по подобию, не вы зы вая необходимо
сти в независимы х оценках, полученных экспериментальным путем. (Как
бы там ни было, некоторые “очевидные” признаки позж е были подвергну
ты сомнению (см., напр., Olson, 1976)). Но когда стимулы усложняю тся,
отнош ения подобия между ним и становятся менее очевидными, так к ак
многие признаки влияю т на общую оценку. В этом исследовании использо
валась установленная к тому времени корреляция между вероятностью и
репрезентативностью , чтобы показать, к ак последняя определяется в вы
борках, характеризую щ ихся более чем одним признаком.
Часто лучш им способом обнаружить, насколько подобны два стимула,
является прямо спросить о подобии. Это немного проблематично, если необ
ходимо узнать, насколько выборка S репрезентативна совокупности Р. Одна
ко полезно уметь оценить это косвенно, например, спросив, насколько веро
ятно то, что выборка S взята из совокупности Р. Второе исследование в этой
главе показы вает жизнеспособность этого подхода, давая описание того, ка
кие свойства выборок делают их репрезентативными в некотором контексте.
Н аконец, в третьем исследовании подчеркивается важное различие м еж
ду репрезентативностью выборки и репрезентативностью результата фор
мирования выборки. В первичном смысле, репрезентативность - это оцен
к а , которая приписывается результатам формирования выборки. Другими
словами, чтобы оценить, насколько выборка репрезентативна популяции в
этом смысле, долж ны быть известны характеристики обеих. Таким обра
зом, имеет смысл оценивать репрезентативность выборки из 15 новорож
денны х, 9 из которых м альчики, им ея перед глазами общее распределение
пола среди новорожденных (известную пропорцию мальчиков). Нет смыс
ла оценивать репрезентативность этой выборки, если пропорция мальчи
ков ни в выборке, ни в популяции не известна. Но существует и другой смысл
репрезентативности, который сделает значимой такж е и вторую оценку. В
этом смысле, выборки более репрезентативны, если их оцениваю т как бо
лее вероятные в первом смысле. Другими словами, независимо от средней
величины совокупности и до того к ак становится известна средняя величи
на вы борки, вы борка из 45 новорожденных более репрезентативна (во вто
ром смысле), чем выборка из 15, потому что она с большей вероятностью
будет напоминать популяцию , если станет известна в ней пропорция м аль
чиков. Следовательно, в выборке из 45 мож ет оказаться 65% м альчиков, а
в выборке и з 15 - 53 % . Но если четко различать эти два смы сла, путаницы
не возникнет.
В третьем исследовании показано, что люди реагирую т на размер выбор
к и , когда делают вторичные оценки репрезентативности, даж е если они ч а
сто не видят подтекст, который обычно бывает у первичных и стандартных
оценок репрезентативности.
6. Оценки репрезентативности и на основе
репрезентативности*
Отношение репрезентативности
Репрезентативность - это соотношение между процессом или моделью М и
некоторым случаем или событием X , связанны м с этой моделью. Репрезен
тативность, к ак и подобие, может быть определена опытным путем, напри
мер, если попросить людей оценить, какое из двух событий, Х 1или Х2, яв
ляется более репрезентативным по отношению к некоторой модели М, или
является ли событие X более репрезентативным по отношению к Mt или М2.
Рассм атриваемая модель могла относится к человеку, монете или мировой
экономике, а соответствующие исходы могли быть описанием, последова
тельностью вы падения орлов и реш ек или ценой н а золото.
Репрезентативность - направленное соотношение: мы говорим, что вы
борка более или менее репрезентативна по отношению к отдельно взятой
совокупности, и что действие является репрезентативным по отношению к
человеку. Мы обычно не говорим, что совокупность репрезентативна по от
ношению к выборке, или что человек репрезентативен по отношению к дей
ствию. В некоторых задачах, однако, можно полностью изменить роли мо
дели и исхода. Н апример, можно оценивать, репрезентативен ли человек
Оценки репрезентативности и на основе... 107
стереотипу библиотекаря или репрезентативно ли занятие библиотекаря
этому человеку.
Мы различаем четыре основных случая, для реш ения которых обычно
используется концепция репрезентативности.
1. М — класс, а X — значение переменной, определенной в этом классе.
Именно в этом смысле мы говорим о (более или менее) репрезентативных раз
мерах дохода профессора колледжа или возрасте вступления в брак в какой-
либо культуре. Естественно, наиболее репрезентативная величина будет близ
ка к средней, медиане или способу распределения соответствующей перемен
ной в классе М. Отношение репрезентативности, главным образом, определе
но в этом случае так, что испытуемый знает распределение частоты соответ
ствующей переменной.
2. М — класс, а X — частный случай этого класса. Больш инство чита
телей, вероятно, согласится, что Джон А пдайк — более репрезентативный
американский писатель, чем Норман М айлер (N orm an M ailer). Конечно, та
кое суждение не основано на частоте; оно отраж ает степень, в которой сти
ли, темы и идеи этих авторов являю тся центральными в современной аме
риканской литературе. Подобные соображения определяют репрезентатив
ность случаев, которые сами скорее являю тся классами, чем частными слу
чаям и. Например, дрозд считается более типичной птицей, чем курица, хотя
он встречается реже (Rosh, 1978; Sm ith, Shoben и R ips, 1974). Таким обра
зом, событие репрезентативно по отношению к категории, если оно имеет
сущ ественные особенности, которыми обладают элементы этой категории,
и если у него отсутствуют отличительные черты , которых нет у членов этой
категории (Rosh, 1975; Tversky, 1977).
Современные разработки в области формирования концепции (Rosh &
M ervis, 1975; M ervis & Rosh, 1981), семантической пам яти (B ransford &
F ranks, 1971) и распознавания образов (P osner& K eele, 1968) показали, что
наиболее репрезентативные, или прототипные, элементы категории лучш е
запоминаю тся, легче вспоминаю тся и распознаю тся, чем элементы, кото
рые являю тся более часты ми, но менее репрезентативными. Кроме того,
люди часто допускают ош ибку, “распознавая” прототипный стимул, кото
рый никогда не демонстрировался. Поэтому репрезентативность может сме
щ ать пам ять распознавания, а такж е оценки частоты.
Надо заметить, что существуют два способа, с помощью которых элемент
может быть высоко репрезентативен по отношению к классу. Два смысла
репрезентативности близко соответствуют отнош ениям типичности и про
тотипичности . Элемент высоко репрезентативен по отношению к категории,
если он типичен или модален; он может такж е быть репрезентативен, если
он является идеальным типом, который воплощ ает сущность категории.
Например, Нью-Йорк является прототипом американского города, в то вре
мя как Ц инциннати можно выбрать как типичный город. Точно так ж е наши
понятия о прототипе и типичной француженке различаются. Первая — веро
108 РЕПРЕЗЕНТАТИВНОСТЬ
ятно молодая, и зящ н ая париж анка, в то время к ак вторая будет полной
ж енщ иной средних лет из провинции.
3. М — класс, а X — подкласс М. Больш инство людей, вероятно, согла
сится, что население Ф лориды менее репрезентативно по отношению к аме
риканском у населению, чем население ш тата И ллинойс, и что студенты,
изучаю щ ие астрономию, являю тся менее репрезентативными по отнош е
нию ко всему студенчеству, чем студенты, изучаю щ ие психологию. К рите
рии репрезентативности различны для подкласса и для отдельного события,
потому что событие м ож ет давать представление о главной тенденции
свойств, в то врем я к ак , подкласс мож ет такж е представлять диапазон и
изменчивость. Человек, чей рост, вес, возраст и доход соответствует сред
ним величинам для американского населения, репрезентативен по отноше
нию к этой совокупности. Группа из 100 человек с одними и теми ж е харак
теристиками не смогла бы представлять изменчивость признаков.
Если класс М состоит из таких отдельных групп, что изменчивость в пре
делах каж дой группы является очень маленькой относительно изменчиво
сти между группами, мы рассматриваем каж дую группу скорее к ак пред
ставителя категории, чем как подкласс. Таким образом, естественно рас
сматривать “дрозда” к ак вид птиц или к ак частны й случай категории “пти
ц а”, хотя множество “дрозды” является подклассом класса птиц. В общем
смысле (2) может рассматриваться к ак частны й случай (3), где подкласс X
состоит из одного члена. Точно так ж е (1) может расцениваться к ак вариант
(2) с одним изм ерением . Три типа репрезентативности различаю тся по
слож ности X , где (1) — одноэлементное событие с единственным призна
ком , (2) — одноэлементное событие с множеством признаков и (3) — много
элементное событие с одним или более признаком.
Особенно важ ны й пример репрезентативности подкласса имеет место,
когда X является случайной выборкой из указанной совокупности. Случай
н ая выборка долж на представлять случайность процесса выбора, а не толь
ко сущ ественные особенности совокупности, из которой она взята. Когда
100 человек отобраны наугад, например, выборка из 53 муж чин и 47 ж ен
щ ин мож ет показаться более репрезентативной, чем выборка из 50 муж чин
и 50 ж енщ ин, потому что первая представляет неравномерность формиро
вания выборки, в то время к ак последняя— нет (Tversky & K ahnem an, 1972b,
3). С татистическая концепция репрезентативной вы борки исследована
Крускалом (K ruskal) и М остеллером (M osteller) (1979а, 1979b).
4. М — (причинная) система, а X — (возможное) последствие. Этот
случай отличается от предшествующих, тем, что М больше не является клас
сом объектов или случаев, а скорее системой, которая порождает различ
ные эффекты . Н апример, М может представлять экономику США, а X —
степень инф ляции, или М может представлять человека, а X действие, вы
полненное М, например, развод, самоубийство, выбор профессии. Здесь, X
репрезентативно по отношению к М, или потому что оно часто связано с М
(например, вы сокая температура обычно сопровождает пневмонию) или
Оценки репрезентативности и на основе... 109
потому что люди верят, правильно или неправильно, что М — это причина
X (например, вы сш ая мера наказания предотвращ ает похищ ения людей).
Тверски и Канеман (1980,8) проиллю стрировали и исследовали вклю чение
причинных схем в оценки условных вероятностей.
Подводя итоги, отношение репрезентативности может быть определено
для (1) величины и распределения, (2) события и категории, (3) выборки и
совокупности (4) причины и следствия. Во всех четырех случаях, репрезен
тативность вы раж ает степень соответствия между X и М, но ее показатели
не одинаковы в этих четырех случаях. В случае (1) на репрезентативность
влияет каж ущ аяся относительная частота или статистическая связь. В слу
чаях (2) и (3) репрезентативность определена прежде всего подобием, напри
мер, одного случая другим, или статистик выборок соответствующим пара
метрам совокупности. Н аконец, в случае (4) репрезентативность определя
ется в значительной степени причинны ми убеждениями (валидными или
нет).
Об о ц ен к е сл о ж н ы х со б ы ти й
Существенное различие между вероятностью и репрезентативностью воз
никает при оценке слож ны х событий. П редположим, что нам дали некото
рую информацию о человеке (например, краткое описание личности) и что
мы размы ш ляем о различны х признаках или комбинациях признаков, ко
торыми этот человек мож ет обладать: род занятий, склонности или полити
ческие симпатии. Один из основных законов вероятности гласит, что деталь
ность может только понизить вероятность. Таким образом, вероятность того,
что данный человек является и республиканцем и художником одновремен
но, долж на быть меньш е, чем вероятность того, что человек является ху
дожником. Это условие основано не только на стандартном исчислении ве
роятности, но такж е и на ненормативных моделях (например, S hafer, 1976;
Zadeh, 1978).
Однако, требование, что Р(А и В) < Р(В), которое можно назы вать прави
лом конъю нкции, не относится к подобию или репрезентативности. Синий
112 РЕПРЕЗЕНТАТИВНОСТЬ
квадрат, например, мож ет быть более подобен синему кругу, чем просто
кругу, и человек может походить на наш образ республиканца и художни
к а больш е, чем на наш образ республиканца. П оскольку подобие объекта
цели мож ет быть увеличено, если добавить к цели особенности, которыми
обладает и объект (см. Tversky, 1977), подобие или репрезентативность мо
гут быть увеличены путем специф икации цели. Если оценки вероятности
опосредованы репрезентативностью или подобием, то возможно строить за
дачи, где соединение исходов окаж ется более репрезентативным и, следо
вательно, более вероятным, чем один из его компонентов.
Линде 31 год, не замужем, искренняя и очень яркая натура. Она увлекается философи
ей. Будучи студенткой, интересовалась проблемами дискриминации и правосудия, а
такж е участвовала в антиядерных демонстрациях.
N 88 94 53 56 32 32
М ежгрупповой
план
N 86 88 55 56 32 32
Обсуждение
Результаты , о которых сообщалось в предыдущ их исследованиях, прямо
подтверждают гипотезу, что люди оцениваю т вероятность событий по сте
пени, в которой эти события репрезентативны по отношению к соответству
ющей модели или процессу. П оскольку репрезентативность события мо
ж ет быть увеличена за счет уточнения, слож ная цель может быть оценена
как более вероятная, чем один из ее компонентов. Этот прогноз был подтвер
жден исследованиями, использую щ ими к ак внутригрупповой, так и м еж
групповой план для совокупности испытуемых с различны м уровнем под
готовки в области статистики.
В отличие от других правил вероятности, таких к ак регресс к среднему,
который труден для понимания испытуемыми с отсутствием опы та в облас
ти статистики, правило конъю нкции является и простым, и легко приме
нимым. Больш инство испытуемых проявило ж елание подтвердить его в аб
страктной форме, хотя почти все они наруш или его на практике, когда оно
находилось в противоречии с интуицией репрезентативности. Полученные
результаты противоречат выводам Johnson-L aird и W ason (1977) относитель
но проверки утверждений “если то” (см. такж е Johnson-L aird, Legrenzi и
Sonino-Legrenzi, 1972). Эти исследователи обнаружили, что большинство
испытуемых потерпело неудачу в заданиях с абстрактным материалом, а
не в конкретны х примерах. С другой стороны, наш и испытуемые подтвер
дили правило конъю нкции в абстрактной форме, но наруш или его в конк
ретных примерах (см. Главу 34).
Вывод о том, что конъю нкция часто каж ется более вероятной, чем один
из ее компонентов, может иметь далеко идущ ие последствия. Н ет причин
полагать, что суж дения политических аналитиков, присяж ны х заседате
лей, судей и врачей независимы от эффекта конъю нкции. Этот эффект, ве
роятно, особенно негативно проявит себя при попы тках дать прогноз отно
сительно будущего, оценивая вероятности отдельно взяты х сценариев. Слов
но смотря в хрустальны й ш ар, политические деятели, футурологи, а такж е
обыватели ищ ут образ того будущего, которое лучш е всего представляет их
модель развития настоящ его. Этот поиск ведет к построению детальны х
сценариев, которы е являю тся внутренне последовательны ми и вы соко
репрезентативны ми по отношению к наш ей модели мира. Такие сценарии
120 РЕПРЕЗЕНТАТИВНОСТЬ
часто оказы ваю тся менее вероятными, чем менее детальные прогнозы, ко
торые ф актически являю тся более вероятными. С увеличением детализа
ции сценария, его вероятность мож ет только устойчиво уменьш аться, но
его репрезентативность, и, следовательно, его очевидная вероятность, мо
ж ет увеличиваться. Уверенность в репрезентативности, по наш ему мнению,
является первичной причиной безосновательного предпочтения детальных
сценариев и иллюзорного смысла интуиции, который часто обеспечивают
такие конструкции.
П утаница между суждениями вероятности и подобия имеет место не толь
ко при прогнозировании неопределенного будущего, но такж е и при рекон
струкции неопределенного прошлого, например, в истории или крим иналь
ны х расследованиях. Здесь такж е, перечень прош лы х событий часто объе
диняется в репрезентативный сценарий, который вклю чает вероятные пред
полож ения относительно неизвестных событий. Включение таких предпо
лож ений может только уменьш ать вероятность того, что полный перечень
событий является истинным, но это обеспечивает ощущ ение репрезентатив
ности и последовательности, которое мож ет увеличивать каж ущ ую ся веро
ятность сценария. Например, гипотеза “обвиняемый покинул место преступ
лен и я” мож ет казаться менее вероятной, чем гипотеза “обвиняемый, поки
нул место преступления из страха быть обвинённым в убийстве”, хотя пос
леднее менее вероятно, чем первое. Хороший рассказ часто менее вероятен,
чем посредственный.
Н аконец, важ но понять, что эффект конъю нкции — это признак более
фундаментальной проблемы. Он просто обнаруживает несогласованность
меж ду логикой вероятности и логикой репрезентативности, которая часто
обусловливает мнения людей относительно неопределенных событий. Так
к ак суждение человека неотделимо от реш ения волную щ их проблем наш ей
ж и зни , конф ликт между интуитивной концепцией вероятности и логичес
кой структурой этой концепции настоятельно требует разреш ения. С одной
стороны, мы не можем с готовностью отказаться от эвристики, которую мы
используем, для оценки неопределенности, потому что многое из наш их
знаний о мире связано к ней. С другой стороны, мы не можем бросить вызов
законам вероятности, потому что они определяют важ ны е истины нашего
мира. Н равится вам это или нет, А не может быть менее вероятно чем (А и
В), и уверенность в противоположном — ошибочна. Н аш а задача состоит в
том, чтобы сохранить всё полезное и эффективное в интуитивном суждении
при исправлении ошибок и предубеждений, к которым оно склонно.
Часть III
Причинность и
атрибуция
7. Общепринятое положение: информация не
обязательно информативна*
С о гл ас о в а н н о с ть и н ф о р м а ц и и и в о с п р и я т и е д р у ги х л ю д ей
Существуют два исследования, которые изучаю т влияние согласованности
информации на предсказание поведения других людей. Оба исследования
показы ваю т заметную слабость согласованности инф ормации. Первое из
них — исследование Л .З . М акАртур (L.Z.M cA rthur) (1972). Ее исследова
нием было прямое тестирование предположений Келли относительно эффек
тов влияни я отличительности, постоянства и согласованности на каузаль
ную атрибуцию. Испытуемым давали короткие описания типа “человек ре
агирует на стимул способом X ” и дополнительно давалась информация по
величинам относительно отличительности, постоянства и согласованности.
Н апример, испытуемым могли сказать: “Во время танца Ральф наступал на
Общепринятое положение... 125
ноги Д ж оан”, и не указать дополнительно, что Ральф наступает на ноги по
чти всех девуш ек (или не наступает на ноги девуш кам), или что Ральф по
чти всегда (или никогда не) наступает н а ноги Д ж оан, и что почти все (или
никто) не наступаю т на ноги Джоан. Затем испытуемых спросили, являлся
ли случай наступания на ноги ошибкой Ральф а, ошибкой Джоан или вино
ваты обстоятельства. Испытуемых такж е попросили предсказать обобще
ние реакции (насколько вероятно, что Ральф должен посоветовать Джоан
записаться в танцевальны й клуб?) и обобщения стимула (насколько веро
ятно, что Ральф наступал н а ноги на ледяном тротуаре?).
Отличительность информация составила 10% разницы в причинно-след
ственном приписывании (подводящем итог по всем причинам) и 63% раз
ницы в ож иданиях относительно обобщения стимула. Постоянство инфор
мации составило 20% разницы в причинно-следственных приписы ваниях
и 14% разницы в ож иданиях относительно обобщения реакции. Н апротив,
согласованность информации Составила меньше 3% разницы в любом из
трех видов вывода. Эти результаты наруш аю т не только здравы й смысл те
ории приписы вания, но и здравый смысл вообще. Х отя испытуемые пола
гают, что важ но знать, наступает ли Ральф на ноги большинству девуш ек и
наступает ли он обычно на ноги Д ж оан, для них совершенно не важ но, на
ступают ли на ноги Джоан другие люди!
Здравый смысл приписы вания или любой другой его разновидности так
же наруш ается в другом исследовании, касаю щ имся восприятия других
людей. М иллер, Гиллен, Ш енкери Редлав (M iller, G illen, Schenker, Radlove,
1973) попросили студентов колледж а прочитать раздел классического ис
следования М илграма (M ilgram , 1963), в котором изучается повиновение.
Половине испытуемых дали ф актические данные исследования М илграма,
показываю щ ие, что практически ко всем испытуемым был применён элек
трошок значительной силы, а к большинству был применён электрош ок м ак
симальной силы . Других ж е испытуемых уверили, что такое поведение бу
дет редким. Затем всех испытуемых попросили оценить двух человек, к
которым был применён электрош ок максимальной силы . По 11 признакам
с большой нагрузкой на оценочный компонент, например, привлекатель
ность, доброжелательность, агрессивность. Только на одну из этих 11 оце
нок согласованность информации имела существенное влияние. Знание того,
что применения электрош ока максимальной силы было модальным пове
дением, ф актически не повлияло на оценки людей, перенесш их максималь
ный ш ок.
Эксперимент с электрошоком
Информация базового значения,
данная испытуемым при наличии
согласованности информации
Беседа со
старш екурсниками 4.73* 8.31*,ь 0.50* 0.77*'ь 3.09*>ь 4.32*,ь
(N =22)
Наличие знаний
базового значения 4.11 6.33ь 0 .94 1.56ь 4.17ь 5.89ь
(N =18)
Группа контроля
3.33* 5.22* 1.39* 2.17* 5.39*-" 7.17*
*1=18)
F (2,55) 6.14* 10.34** 6.59* 6.65* 13.24** 8.19**
помещ ена пом етка, показы ваю щ ая среднюю оценку, и было обозначено
количество студентов, на мнении которых было основано среднее значение.
Эти N располагались по порядку от 26 до 142. Средняя оценка каждого кур
са указы валась таким образом, чтобы быть идентичной средним оценкам,
данным студентами-старш екурсниками, принимавш ими участие в беседе.
Структура эксперимента позволяет сравнить эффективность рекоменда
ций, основанных на информации из первых рук, то есть кратких коммента
риях двух или трех студентов, которые проходили курс, с эффективностью
более устойчивой, глубоко обоснованной информации. В таблице 1 представ
лено среднее количество рекомендованных (средние оценки 2.50 или луч
ш е), нерекоммендованных (средние оценки 3.75 или хуже) и неупомяну
тые курсы , выбранные этими тремя группами. Около каж дой категории
приведена оцененная тенденция выбора, индекс, который дает нулевую над
бавку к курсу, если его не выбрали, 1, если он был помечен «галочкой» и 2,
если он был обведен «круж ком».
М ожно заметить, что проведение беседы со старш еклассниками имело
большее воздействие на выбор курса. Испытуемые этой группы были склон
ны пройти рекомендованные курсы и менее склонны пройти нерекомендо
138 ПРИЧИННОСТЬ И АТРИБУЦИЯ
ванны е или неупомянутые курсы , чем испытуемые контрольной группы.
Н апротив, метод базового значения повлиял только на выбор неупомяну
ты х курсов.
Можно поспорить, что группа испытуемых, у которых была беседа со стар
ш екурсникам и, обладала большим количеством информации, чем группа
базового значения. Одной из версий для этого аргумента является именно
то, что мы хотели предложить. Н аш и студенты вели себя, как будто они и з
влекли больш е информации из комментариев пары человек в личной бесе
де, чем из сухих, статистических данных целы х совокупностей. Д ругая вер
сия этого аргумента, - то, что комментарии, сделанные студентами при лич
ной беседе, содержат очень ценную информацию, не доступную в условии
базового значения, относительно, например, организации курсов, процедур
аттестации.
Чтобы задействовать последнее возраж ение, мы провели аналогичное
исследование с одним важ ны м изменением. Группе базового значения дали
дословные письменные комментарии, сделанные студентами-старшекурс-
никам и, участвующ ими в беседе. Кроме того, эти комментарии были явно
описаны к ак репрезентативные взгляды студентов, проходящ их курс, ото
бранные из общего количества оценок в конце семестра. В этом случае, на
испы туемы х, которым были доступны устойчивые средние оценки, осно
ванны е на больш их и полных совокупностях, с дословными комментария
ми студентов, и со “знанием”, что они являю тся репрезентативными ком
м ентариям и, было оказано меньше давления в их выборах, чем на испыту
емы х, которые просто слы ш али устные комментарии старш екурсников в
личной беседе.
*Данная глава - первая часть книги, которая появилась в редакции М. Фишбайн, Прогресс
в социальной психологии. Hillsdale, N.J.: Lawrence Erlbaum Assoc., Inc, 1980. Переиздано в
соответствии с разрешением.
Причинные схемы при принятии решений... 141
конструктивной работе Х айдера (H eider), а исследование причинно-след
ственного приписы вания стало одним из центральны х в современной соци
альной психологии (Jones и другие, 1971; Ross, 1977).
В этой главе описывается роль причинно-следственных схем при приня
тии реш ений в условиях неопределенности. В частности, мы исследуем оцен
ки условной вероятности Р (Х/D ) некоторого целевого события X , на основе
некоторого свидетельства или данных D. Д ля психологического анализа воз
действия свидетельства, полезно различать типы отнош ений, которые ис
пытуемый мож ет увидеть между D и X . Если D воспринимается к ак причи
на возникновения или невозникновения X , мы считаем D причинно-след
ственными данны ми. С другой стороны, если X воспринимается к а к воз
м ож ная причина D, мы рассматриваем D к а к диагностические данные.
Например, считается, что описание личности А обеспечивает причинно-след
ственные данные для прогнозирования его поведения, в то время к ак описа
ние поведения А обеспечивает диагностическую информацию относитель
но его личности. Если D не является ни причиной, ни результатом X , но они
оба воспринимаю тся к ак последствия другого ф актора, мы считаем D пока
зательны ми данными. Таким образом, поведение в одной ситуации обеспе
чивает показательны е данные для поведения в другой ситуации, если обе
манеры поведения расценены к ак проявления одной и той ж е черты . Н ако
нец, если оказы вается, что D и X , не связаны прямой или косвенной при
чинной связью , мы назы ваем D случайными данными.
При нормативном рассмотрении теории условной вероятности, различия
между типами отнош ения D к X невещ ественны, и воздействие данных за
висит исклю чительно от их информативности. Н апротив, мы предполага
ем, что психологическое воздействие данных зависит от их роли в причин
но-следственной схеме. В частности, мы выдвигаем гипотезу, что причин
но-следственные данные имеют большее воздействие, чем другие данные
такой ж е информативности; и что в присутствии данны х, порождаю щ их
причинно-следственную схему, случайные данные, не соответствующие этой
схеме, имеют маленькое значение, или вовсе его не имеют.
В этой части книги мы сравниваем влияние причинны х и диагностичес
ки х данны х и показы ваем, что лю ди приписываю т большее воздействие
причинны м, чем диагностическим данным равной информативности. Мы
такж е исследуем класс проблем, где отдельно взяты е данны е имеют к ак
причинно-следственное, так и диагностическое значение, и демонстриру
ем, что интуитивны е оценки Р (Х/D ) зависят от прямого причинного воз
действия D на X без учета диагностических соображ ений....
142 ПРИЧИННОСТЬ И АТРИБУЦИЯ
П р и ч и н н о е и д и агн о с ти ч е с к о е у м о за к л ю ч е н и е
Логически выведенные асиммет рии
П ричинно-следственная схема носит естественный ход событий; он разви
вается от причин к следствиям. Мы предполагаем, что легче и более есте
ственно следовать нормальной последовательности и рассуж дать от причи
ны к следствию , чем обратить эту последовательность и рассуждать от след
ствий к причине. Если причинно-следственные выводы действительно бо
лее легкие и естественные, чем диагностические выводы, то можно ожидать,
что люди выведут результаты из причин с большей достоверностью, чем при
чины из результатов - даж е, если результат и причина ф актически дают
одинаковое количество информации относительно друг друга. Мы провери
ли эту гипотезу, используя две различны е величины: оценки условной ве
роятности и достоверность точности предсказаний.
В одном наборе вопросов мы попросили испытуемых сравнить две услов
ные вероятности Р (Y/X ) и Р (X /Y ) для пары событий X и Y таких, что (1) X
естественно рассматривается к ак причина Y; и (2) Р (X) = Р (Y), то есть пре
дельны е вероятности двух событий равны . Последнее условие подразуме
вает что Р (Y /X ) = Р (Х/Y ). Мы сделали прогноз, что большинство испытуе
мы х сочтет причинно-следственное отношение более сильны м, чем диагно
стическое, и ошибочно утвердит, что Р (Y/X ) > Р (X /Y ).
В другом наборе вопросов мы попросили испытуемых сравнить достовер
ность прогнозов с использованием двух непрерывных переменных: зависи
мость от одной бы ла дана, а другую необходимо было спрогнозировать. Как
и ранее, задачи построены таким образом, чтобы одна из переменных рас
сматривалась к ак причинная относительно другой. Если две переменные
обладают подобными предельными распределениями, не существует надеж
ной статистической причины ож идать различие в точности, с которой одна
переменная может быть спрогнозирована исходя из другой. Однако мы выд
винули гипотезу, согласно которой многие испытуемые посчитают, что про
гнозирование от причины к результату может быть сделано с большей дос
товерностью, чем предсказание от результата к причине.
Прогнозированная асимметрия между причинными и диагностическими
выводами наблюдалась с двумя типами вопросов. Эффект проиллюстрирован
следующими задачами, где числа в круглых скобках указывают количество
студентов (Университета ш тата Орегон), которые выбрали каж ды й ответ.1
Задача 1 : Какое из следующих событий является более вероятным?
(А), что у девочки голубые глаза, если у ее матери голубые глаза. (N = 69)
1В более раннем варианте этой книги была приведена неправильная - низкая пропорция
ответов “поровну”, основанных на выборке из Израиля. Мы обязаны Анне М. Б. Гонзалес и
Майклу Кубовому за это наблюдение. Настоящие данные, собранные в Университете штата
Орегон, совпадают с результатами, полученными Гонзалес в Йельском университете.
Причинные схемы при принятии решений... 143
(В), что у матери голубые глаза, если у ее дочери голубые глаза. (N = 21)
(-) два события одинаково вероятны. (N =75)
Очевидно, что распределение роста или цвета глаз - по сущ еству одно и то
ж е в следующ их друг за другом поколениях. Чтобы проверить восприятие
этого ф акта, мы спросили другую группу из 91 испытуемых, является ли
пропорция матерей с голубыми глазам и в большой выборке матерей и доче
рей больш ей (N = 15), равной (N = 64) или меньш ей (N = 12), чем пропорция
дочерей с голубыми глазам и. Таким образом, хотя испытуемые оценили
предполагаемые вероятности к ак равные, они оценили “причинную” услов
ную вероятность выш е, чем “диагностическую ”.
Строго говоря, рост отца не обуславливает рост его сына. В обиходе, одна
ко, весьма приемлемо говорить, что мальчик высок, потому что рост его отца -
б футов 4 дюйма, в то время к ак утверждение, что рост отца - б футов 4
дюйма, потому что его сын вы сок, соверш енно аномально. В общем, мы
ожидаем асимметрию вывода относительно двух переменных всякий раз,
когда первая объясняет вторую лучш е чем вторая объясняет первую. Д ля
иллю страции, рассмотрим следующие задачи, которые были представле
ны двум различны м группам испытуемых:
Задача 3: Какое из следующих утверждений имеет больше смысла?
(A) Том тяжелый, потому что он высокий. (N = 63)
(B) Том высокий, потому что он тяжелый. (N = 7)
Задача 4: Какое из предсказаний более достоверно?
(A) прогнозирование роста человека исходя из его веса. (N = 16)
(B) прогнозирование веса человека исходя его роста. (N = 78)
Х отя рост и вес не считаю тся причинами друг друга, большинство испытуе
мых посчитало, что вы сокий рост человека лучш е объясняет большой вес,
чем наоборот, возможно, потому что прототипичный вы сокий человек об
ладает больш им весом, в то врем я к а к прототипичный тяж елы й человек не
всегда вы сокий. Соответственно, большинство испытуемых вы разило боль
шую уверенность в прогнозировании веса человека исходя из его роста, чем
в прогнозировании роста человека исходя из его веса. Т акая асимметрия,
безусловно, не мож ет быть оправдана на статистических основаниях.
Задачи 3 и 4 свидетельствуют о том, что асимметрия вывода происходит
даже при отсутствии прямой причинной связи между этими двумя перемен
ными - если одна из них (например, рост) более естественно рассматривается
к ак объяснение другой (например, вес). Следующие две задачи иллюстриру
ют случай, где две переменные рассматриваю тся к ак признаки или проявле
144 ПРИЧИННОСТЬ И АТРИБУЦИЯ
ния некоторой основной черты. Одна из переменных, однако, обеспечивает
более прямое проявление или более надежную меру основной черты. Мы ож и
даем, что выводы от более сильного к более слабому признаку будут сделаны
с большей достоверностью, чем выводы в обратном направлении.
Задача 5: Какое из следующих событий является более вероятным?
(A) , то, что атлет выиграл десятиборье, если он выиграл первое состязание в де
сятиборье. (N=21)
(B) , то, что атлет выиграл первое состязание в десятиборье, если он выиграл де
сятиборье. (N = 75)
(-) два события одинаково вероятны. (N = 70)
Р(С & D)
Р(С /D ) = > Р (С )
P (D )
сохраняется, тогда и только тогда, когда Р (С & D) > Р (С) Р (D), что верно
тогда и только тогда, когда
Р(С & D)
Р (С )< = P (D /C )
Р (С )
что в свою очередь подразум еваетР(Б/С )>Р(Б/С ), если Р (С) и_Р (D) не рав
ны н улю . С лед овательн о, п о д р азу м евает P (C /D )> P (C /D ), воп реки
P (D /C )> P(D /C ) преобладающему образцу суждений.
Л егко построить дополнительные примеры подобного типа, в которых
интуиция людей наруш ает вычисление вероятности. Такие примеры состо
я т из пары событий, А и В, таких, что возникновение В увеличивает вероят
ность последующ его возникновения А , в то время к ак возникновение А
уменьш ает вероятность последующего возникновения В. Н апример, рас
смотрите следующую задачу.
Задача 8: Пусть А - событие, что до окончания следующего года, Питер установит сис
тему сигнализации в своем доме^Пусть В - событие, что дом Питера будет обокраден до
конца следующего года. Пусть А и В события, противоположные событиям А и В, со
ответственно2. _
Вопрос: Какая из двух условных вероятностей, Р (A/В ) или Р (A/В ), выше?
Вопрос: Какая из двух условных вероятностей, Р (В/A ) или Р (В /А ), выше?
*В этой главе многое заимствовано, как по содержанию, так и по структуре, из статьи пер
вого автора в книге “Advances in Experimental Social Psychology” (1977). Разрешение на
использование этих материалов подтверждено.
154 ПРИЧИННОСТЬ И АТРИБУЦИЯ
чем неподчинение. Психолог-любитель, подобно профессиональному пси
хологу, такж е всецело полагается на данные, хотя они редко соответствуют
формальным требованиям случайности и репрезентативности.
И ногда эти данны е и з первы х рук; чащ е, они являю тся результатом
неофициального общения, получены из средств массовой информации или
других косвенных источников. Далее интуитивный психолог должен выб
рать или разработать методы кодирования, хранения и восстановления дан
ны х. Н аконец, он должен использовать различные стратегии для подведения
итогов, анализа и интерпретации данных - то есть он должен использовать
правила, эвристики или схемы, которые позволят ему формировать новые
выводы. Способность интуитивного ученого исследовать свое социальное ок
руж ение, соответственно, будет зависеть от точности и адекватности его ги
потез, доказательств и анализов. Наоборот, любые систематические ошибки
в существующих теориях, предубеждения в доступных данных или несоот
ветствия в методах анализа, влекут за собой серьезные последствия, к ак для
психолога-любителя, так и для общества, которое он создает. Эти недостат
ки , исследуемые с точки зрения современной теории атрибуции, подробно
анализирую тся в этой гл а в е.1
Основные принципы теории атрибуции были предлож ены Хайдером
(H eider, 1944,1958) и развиты более детально Джонсом и Девисом (Jones &
D avis, 1965), К елли (Kelley, 1967,1971, 1973) и их коллегами (см. Jones и
другие, 1971; W einer, 1974). В центре внимания этих ученых находились
две родственные задачи, с которыми сталкивается ученый-любитель. Пер
вая - задача причинны х суждений: исследователь стремится определить
причину или набор причин, к которым можно приписать отдельно взяты й
эффект (то есть, некоторое действие или исход). Вторая - задача социально
го предполож ения: наблюдатель события делает выводы относительно ат
рибуции или намерений действующ их лиц, а такж е относительно призна
ков или свойств ситуаций, н а которые они реагировали.
И причинны е оценки, и задачи социального предположения были пред
метом интенсивного теоретического и эмпирического исследования и , до
недавнего времени, ф актически доминировали в теории атрибуции. В пос
леднее врем я, однако, начала получать некоторое внимание третья задача
интуитивного психолога - прогнозирование или оценка исходов и поведе
ния. И нтуитивны й психолог должен не только искать объяснения и делать
выводы о нам ерениях; он должен такж е формировать ож идания и вы ска
зы вать предполож ения относительно действий и исходов, неизвестных в на
стоящ ее время или которые произойдут в будущем. Н апример, когда к ан
дидат в президенты обещает «облегчить бремя среднестатистического нало
гоплательщ ика», мы рассматриваем возможные причины для этого заяв
ления и делаем выводы относительно личны х свойств кандидата. (Возмож
Н е м о ти в а ц и о н н ы е п р ед у б еж д ен и я атр и б у ц и и
q Прогнозы, сделанные б ез
промедления
х
ф
а А Задерж ка прогнозирования,
О
X вызванная смущением
д Задерж ка прогнозирования
ф без смущения
X
X Ф Значения, полученные
§■ Милграмом (1963)
о
а
а) сумма оценок для четы рех черт; большее число обозначает большую
уверенность и более крайние выводы
Источник: обобщено из Ross, G reene и H ouse (1977).
Общие выводы по результатам Росса, Грина и Х ауса (1977) для наш ей кон
цепции интуитивного психолога очевидны. Оценки отклонения и нормы, и
совокупность социальных выводов и межличностных реакций, которые со
провождаю т такие оценки, являю тся смещ енными в соответствии с соб
ственными поведенческими выборами обывателей. Очевидно, что анализ
приписы вания мож ет быть искаж ен не только ош ибками в анализе соци
альны х данны х интуитивным психологом, но такж е и более ранними пре
дубеждениями в формировании выборки или оценке таких данных.
Некоторые немотивационные факторы играю т роль в создании явлений
ложного консенсуса. Главные среди них: (а) факторы выборочного воздей
ствия и доступности; (Ь) факторы , имеющие отношение к разреш ению си
туативной неоднозначности.
Ф акторы выборочного воздействия, леж ащ ие в основе ложного консен
суса, довольно просты. Очевидно, мы знаем и общ аемся с лю дьми, которые
разделяю т наш опыт, интересы, ценности и взгляды . Эти люди действитель
но реагирую т так, к ак отреагировали бы мы в ш ироком разнообразии обсто
ятельств. Действительно, наш е окруж ение частично определено чувствами
общего консенсуса, и мы склонны избегать тех, кто вряд ли разделяет наш и
оценки и реакции. Тот ф акт, что мы выступаем перед пристрастной выбор
кой людей и поведения не требует, чтобы мы допускали ош ибку в наш их
оценках относительно соответствующих совокупностей, но оно делает та
кие ош ибки вероятными. Ф акторы , усиливаю щ ие наш у способность вспо
168 ПРИЧИННОСТЬ И АТРИБУЦИЯ
м инать, визуализировать или воображать образцовые случаи поведения
являю тся более тонкими и когнитивны ми по характеру. В данной ситуа
ции определенные типы поведения, которые мы выбрали или выбрали бы
могут быть с большей легкостью восстановлены из памяти и более легко пред
ставлены , чем противоположные типы поведения. Согласно Канеману и
Тверскому (1973,4) поведенческие выборы, которым мы отдаем предпочте
ние, могут быть более когнитивно “доступны”, и нас можно ввести в заб
луж дение этой легкостью или трудностью доступа при оценивании вероят
ности соответствующ их поведенческих выборов.
Второй немотивационный источник эффекта ложного консенсуса явл я
ется результатом реакции интуитивного психолога на неоднозначность -
к а к относительно природы и величины ситуативных сил, так и относитель
но значения и последствий различны х альтернатив реакции. П опытки снять
такую неоднозначность включаю т интерпретацию , оценку и догадки, при
чем все это мож ет оказы вать параллельны й эффект на собственные выборы
поведения наблюдателей, а такж е на их прогнозы и выводы относительно
выборов других людей. Таким образом, испытуемые, которые ож идали и
боялись насмеш ек других людей, потому что на них была табличка «Обе
дайте в каф е “У ДЖ О” », а такж е те, которые сочли пож елания и ож идания
экспериментатора банальны ми, вероятно, откаж утся носить рекламны й
щ ит, поддерж ат подобные отказы других людей и сделают соответствую
щ ие выводы относительно черт характера любого испытуемого, который со
гласился носить табличку. Противоположные приоритеты, конечно, при
вели бы к противоположным личным выборам и противоположным соци
альны м оценкам и выводам.
И так, предубеждение ложного консенсуса, к ак отраж ает, так и создает
искаж ения в процессе атрибуции. Оно следует из неслучайного формирова
н ия выборки и поиска свидетельства и от необычного реш ения неоднознач
ны х ситуативны х факторов и сил. В свою очередь, оно смещ ает оценки от
носительно нормы и отклоняется и увеличивает расхож дения и ошибки в
интерпретации социальных явлений.
У сто й ч и в о сть у б еж д ен и й в о п р ек и о п ы ту
Различны е недостатки интуитивного психолога, те, которые описаны в этой
главе и ряде других работ (см. N isbett и Ross, 1980), могут привести его к
тому, что он будет придерж иваться убеждений о себе, других лю дях или
даж е природе социального мира, которые являю тся преждевременными и
ош ибочными во многих случаях. П ока о них никто не знает и никто на них
не влияет, такие убеж дения могут казаться непоследовательными - просто
предварительными по сути и адаптивными к новым входным данным. По
степенно увеличиваю щ ийся объем теории и исследования, однако, может
теперь привести к совершенно противоположному выводу.
Недостатки процесса атрибуции... 169
О казы вается, что убеж дения, от относительно узких личны х впечатле
ний до более ш ироких социальных теорий, являю тся очень устойчивыми
вопреки опыту, который каж ется логически разруш ительны м. Две пара
дигмы иллюстрируют эту устойчивость. П ервая включает способность убеж
дения продолжает сущ ествовать и усиливаться новыми данны ми, которые,
с нормативной точки зрения, должны приводить к тому, что убеждения ста
новятся более умеренными. Вторая вклю чает сохранение убеждений после
отрицания их первоначальных оснований.
Являются сторонниками
высшей меры наказания Е ) сторонники
+3
I I противники
+2
+1
Без изменений О
Являются противниками -1
высшей меры наказания Является превентивной Не является превен-
мерой тивнои мерой
------- 1------------ 1--------------- 1------------ - 4 - -----
1 2 3 4
Результаты Подробности Результаты Подробности
Являются сторонниками
высшей меры наказания
+2
+1
Без изменений О
-1
Являются противниками -2
высшей меры наказания Является превентивной Не является превен-
мерой тивной мерой
1 2 3 4
Результаты Подробности Результаты Подробности
они узнали, что хорошие или плохие методы обучения явились объяснени
ем успехов или неудач, служ ивш их основанием для таких впечатлений.
Устойчивость дискредитированных теорий после опровержения. Недав
ние эксперименты Андерсена, «Пеппера и Росса (1980) расш ирили область
проявлений устойчивости от личны х впечатлений до более обширных убеж
дений о реальном мире. В исследованиях Андерсена и других сначала со
здавались, а затем дискредитировались теории испытуемых относительно
ф ункциональны х отнош ений меж ду двумя измеряемы ми переменными:
адекватностью профессиональных действий пож арны х и количеством оч
ков, набранных в тесте на предпочтение риска. В одном варианте формиру
ющ ие сведения состояли из пары определенных случаев, то есть, один со
стоявш ийся и один несостоявш ийся пож арны й с соответствующим проти
воречивым количеством очков в тестах на предпочтение риска. Интересно,
такие минимальны е данные были достаточными, чтобы породить устойчи
вые теории, со стороны испытуемых, относительно вероятных связей меж
ду соответствующ ими измерениями. Более важ ны м был вывод, что такие
теории переж или опровержение - рассматриваемые случаи были полнос
тью ф иктивны м и, и различны е испытуемые, ф актически, получили проти
воположные пары очков рискованности и результатов работы. Действитель
но, когда сравнения были сделаны между испытуемыми, с которыми экс
перимент проанализирован, и теми, с которыми нет, оказалось, что более
чем 50% начального эффекта информации в рам ках “случая” осталось пос
ле опроверж ения.
Недостатки процесса атрибуции... 175
И так, ясно, что убеждения могут сохраняться, несмотря на сильные ло
гические или эмпирические сомнения. Они могут сохраняться и даже уси
ливаться за счет сведений, которые, к ак согласилось бы большинство нейт
ральны х наблюдателей, логически должны приводить к некоторому ослаб
лению таких убеждений. Они могут даж е сохраняться после полного разру
ш ения их первоначальных основ. Необходимо сделать многое для опреде
ления точных пределов и исследования неизбежных исклю чений к таким
явлениям . Ясно, что издерж ки предубеждений атрибуции обывателей и
другие недостатки не подвержены коррекции, но вместе с тем сглаж иваю т
ся за счет последующего опы та и обсуждений. Вопрос, который необходимо
наконец задать -- это как и почему такая устойчивость имеет место? То есть,
каки е когнитивны е механизмы леж ат в основе необоснованного постоян
ства наш их впечатлений, убеждений и более ш ироких социальных теорий?
П р и ч и н н ы е и с л у ч а й н ы е б а зо в ы е з н а ч е н и я
Базовое значение назы вается причинны м, если оно предполагает существо
вание причинного ф актора, который объясняет, почему отдельный случай
приведет скорее к этому исходу, чем другой. Базовое значение назы вается
случайны м, если оно не ведет к такому выводу.
Я ркая демонстрация контраста между причинны ми и случайными базо
выми значениями была представлена Айзеном (A jzen, 1977). В одном экс
перименте, респонденты оценили вероятность того, что студент, академи
ческая успеваемость которого бы ла кратко описана, успешно сдал отдельно
взяты й экзамен. Причинное базовое значение было представлено следую
щ им образом:
Два года назад сдавался заключительный экзамен в Йельский университет. Приблизи
тельно 75% студентов потерпели неудачу (успешно сдали) экзамен.
и , следовательно
Д р у ги е д о к а з а т е л ь н ы е п ер ем ен н ы е
П ричинны й или случайны й характер данных базового значения не един
ственная доказательная переменная, которая влияет на интуитивные оцен
ки . Д аж е в отсутствии причинной интерпретации, данные базового значе
н и я не заменяю тся неопределенными, обедненными или непоследователь
ными данными случая. Например, Бар-Х иллел (1980а) изучала версию пер
воначальной задачи с такси, в которой информация относительно свидете
л я (пункт Ь) бы ла заменена сообщением, что сбившее человека такси было
оборудовано селекторной связью (переговорными устройствами) и что се
лекторная связь установлена в 80% Зелены х такси и в 20% Синих такси.
В этой задаче, (случайное) базовое значейие не было отвергнуто, и средний
ответ был 0.48. Бар-Х иллел предполож ила, что сведения относительно се
лекторной связи не заменили базовое значение, потому что они менее опре
деленные, чем идентиф икация свидетелем. Таким образом, данные базово
го значения объединяю тся с другими сведениями в двух случаях: если пер
Очевидное воздействие базового значения 185
вые имеют причинную интерпретацию , или если последние не являю тся
более определенными, чем базовое значение (B ar-H illel, 1980а).
И специф ика, и причинная связь могут помочь объяснить различие м еж
ду результатам и Канемана и Тверского (19 7 3 ,4 ), которые обнаружили су
щественное пренебрежение базовым значением в прогнозировании области
специализации студента на основе краткого описания личности и результа
тами М акКоли и Ститта (McCauley и S titt, 1978). Когда они обнаружили су
щественную корреляцию между оцененным базовым значением черт харак
тера и оцененными вероятностями этих черт при указании национально
сти, например, вероятность, что человек является практичны м, если он не
мец. Кроме нескольких процедурных различий, последнее исследование
отличается от первого в трех важ ны х аспектах. Во-первых, испытуемых
просили спрогнозировать скорее относительную частоту (например, пропор
ция немцев, которые являю тся практичны м и), чем вероятность для инди
видуального случая. Во-вторых, сведения состояли скорее из принадлеж
ности к классу, например, немец, чем детальны х описаний определенного
человека. В-третьих, частоту базового значения черт характера легче при
чинно интерпретировать, чем частоту базового значения профессий. Обы
вательские теории личности предлагаю т причины , почему больш инство
людей лю бят повеселиться, и только некоторые из них мазохисты. Эти при
чины могут объяснить поведение людей вообще и немцев, в частности, та
ким образом, обеспечивая причинную интерпретацию базового значения
черт характера.
Особенно интересно рассмотреть ситуацию , касаю щ ую ся определенных,
но недиагностических сведений (например, описание человека, одинаково
подобного инж енеру и адвокату). Экспериментальные выводы здесь не пол
ностью последовательны. Канеман и Тверский (1973, 4) обнаружили пре
небрежение базовым значением, в то время к ак Джиносар и Троуп (G inosar
и Trope, 1980) обнаружили исклю чительную уверенность в данных базово
го значения при подобных экспериментальны х условиях. Больш инство ис
следований, однако, получили промежуточные результаты, где базовое зна
чение не было отвергнуто, а скорее ослаблено недиагностическими сведени
ями относительно данного случая (см. например, M anis и другие, 1980; W ells
и H arvey, 1977).
В н утрен н и е и л и вн еш н и е п р и п и с ы в а н и я
Несколько задач с базовым значением, представляющ их особый интерес для
социальных психологов, возникает, когда сведения и базовое значение от
носятся соответственно к внутренне-поведенческим и к внеш не-ситуатив
ным ф акторам, которые влияю т на исход. Успех студента на экзамене, на
пример, определен к ак трудностью экзам ена, так и талантом студента. Точ
но так ж е ответ на просьбу пожертвовать деньги в благотворительное пред
приятие зависит к ак от щ едрости дающ его, так и от характера просьбы.
186 ПРИЧИННОСТЬ И АТРИБУЦИЯ
В неш ние ф акторы , таки е к а к трудность экзам ена и ли эф ф ективность
просьбы, естественно, выражены соответствующими базовыми значения
ми (например, 75% студентов провалили экзамен; большинство людей вне
сло вклад в благотворительное предприятие). Вопрос об относительном воз
действии ситуативны х и поведенческих факторов в социальном приписы
вании, таким образом, мож ет быть повторно сформулирован в терминах
значения, которое придается соответствующим базовым значениям.
Нисбетт и Боргида первыми исследовали связь между использованием
информации базового значения в исследовании оценок и относительным
весом ситуативных факторов в изучении атрибуции поведения. Они пока
зали, что в исследовании Д арли-Л атана (D arley-Latane, 1968) знание того,
что испытуемые редко оказы вали помощь, не затрагивало прогнозов испы
туемых относительно поведения отдельного участника исследования, кото
ры й был показан в кратком интервью, снятом на камеру. Исследование Нис-
бетта и Боргиды (1975) внесло вклад в пересекаемость когнитивны х и соци
ально-психологических подходов к изучению оценивания. Это такж е выз
вало противоречие (B orgida, 1978; W ells и H arvey, 1977,1978) и ряд иссле
дований роли согласованности информации в прогнозировании поведения
(B orgida и Brekke, 1981; K assin, 1979b; N isbett и Ross, 1980; Ross, 1977).
В отличие от примеров с экзаменами и такси, в которы х причинные и
случайны е базовые значения ясно различим ы , базовые значения во многих
исследованиях консенсуса подвержены альтернативным интерпретациям.
Чтобы это проиллю стрировать, давайте сравним исследование Нисбетта и
Боргиды (1975) с причинным условием базового значения в эксперименте
А йзена (A jzen, 1977), где испытуемые оценили вероятность того, что отдель
но взяты й студент сдаст экзамен, который провалили 75% группы. Фор
м альная структура двух задач одна и та ж е, но базовым значением в значи
тельной степени пренебрегали в первом исследовании и использовали в пос
леднем. К аж ется, что необычному базовому значению давали ситуативную
интерпретацию в исследовании А йзена, но оно интерпретировалось к ак слу
чайное формирование выборки в исследовании Нисбетта-Боргиды.
Оценки испытуемых А йзена указы ваю т, что они вывели из низкого ба
зового значения успеха, что экзамен был труден, хотя они могли использо
вать те ж е самые сведения, чтобы прийти к выводу, что студенты, которые
проходили тест, не были достаточно умными. Н апротив, испытуемые Нис
бетта и Боргиды , очевидно приш ли к выводу, что участники исследования
об оказании помощи были главны м образом бесчувственными и жестокими
людьми (W ells и H arvey, 1977). Они не приш ли к правильному заклю че
нию , что ситуация исследования Д арли-Л атана не располагала к проявле
нию помощи.
П риписано ли экстремальное базовое значение случайному формирова
нию выборки или ситуативным ф акторам, зависит от контекста проблемы:
более вероятно, что необычное распределение результатов тестов возникло
из-за сложности (или легкости) экзамена, чем из-за необычного состава груп
Очевидное воздействие базового значения 187
пы. С другой стороны тяж елее пересмотреть концепцию относительно ус
ловий, при которы х люди помогают незнакомому человеку, которого хва
тил удар, чем предположить, что участники исследования об оказании по
мощи были исклю чительно бессердечными.
Очевидное пренебрежение данными базового значения в прогнозах от
дельных случаев связано с выводом относительно необычных характерис
тик членов группы. П ричинная интерпретация базового значения становит
ся более вероятной, если этот вывод блокирован. Эта гипотеза была поддер
ж ана несколькими исследованиями, которые восстановили эффект вл и я
ния базового значения, подчеркивая репрезентативность выборки, в кото
рой наблюдалось необычное поведение (H ansen и Donoghue, 1977; H ansen и
Lowe, 1976; W ells и H arvey, 1978). Воздействие данны х базового значения
было даж е увеличено в одном исследовании, сообщая испытуемым, что вы
борка, для которой давались базовые значения, бы ла большой и поэтому
надежной (K assin, 1979а). Главное заклю чение этого и сследован ия-то, что
использование или пренебрежение согласованностью информации в отдель
ном прогнозе критически зависит от интерпретации этой информации.
Часть IV
Доступность
11. Доступность: эвристика оценки частоты
и вероятности*
В вед ен и е
Больш инство недавних исследований были посвящ ены проблемам валид
ности и последовательности оценок вероятности и частоты. Однако извест
но мало о психологических механизмах, с помощью которых люди оцени
вают частоту классов или вероятность событий.
Мы предполагаем, что при столкновении с трудной задачей оценки веро
ятности или частоты, люди используют ограниченное количество эвристик,
которые сокращ аю т эти оценки до более простых. Ранее мы проанализирова
ли подробно одну из таких эвристик - репрезентативность. С помощью этой
эвристики, событие оценивается к ак вероятное настолько, насколько оно
представляет существенные особенности своей родительской совокупности
или процесса, породившего его....
При оценке вероятности события с помощью репрезентативности, чело
век сравнивает существенные особенности события со структурой, из кото
рой оно исходит. Таким образом, человек оценивает вероятности, оценивая
подобие или коннотативное расстояние. С другой стороны, можно оценить
вероятность, используя доступность, или ассоциативное расстояние. Из ж и з
ненного опыта мы знаем, что частные случаи больших классов вспомина
ются лучш е и быстрее, чем случаи менее часты х классов, что вероятные со
бытия легче вообразить, чем маловероятные, и что ассоциативные связи уси
ливаю тся, когда два события часто происходят одновременно. Таким обра
зом, человек мог оценить численность класса, вероятность события или ча
стоту взаимосвязанны х появлений событий, оценивая легкость, с которой
мож ет быть выполнено соответствующее умственное действие формирова
ния вы борки, построения или ассоциации.
*Эта глава - сокращенная версия работы, которая появилась в Cognitive Psychology, 1973,
4,207-232. Авторское право© 1972 Academic Press, Inc. Переиздано в соответствии с разре
шением
192 ДОСТУПНОСТЬ
Например, можно оценивать пропорцию разводов в данном обществе, вспо
м иная разводы среди знакомых; можно оценивать вероятность того, что по
литический деятель проиграет на выборах, рассматривая различные спосо
бы, с помощью которых он может потерять поддержку; и можно оценивать
вероятность того, что жестокий человек “увидит” хищ ных зверей в карточ
ках Рорш аха, оценивая силу ассоциации между насилием и хищ никами. Во
всех этих случаях, оценка частоты класса или вероятности случая опосредо
вана оценкой доступности1. Считается, что человек использует эвристику
доступности всякий раз, когда он оценивает частоту или вероятность за счет
легкости, с которой события или ассоциации могут прийти ему в голову. Что
бы оценить доступность, совсем не обязательно выполнять фактические дей
ствия формирования выборки или построения. Достаточно оценить легкость,
с которой эти действия могли быть выполнены, подобно тому, как трудность
загадки или математической задачи может быть оценена без рассмотрения
определенных решений.
То, что ассоциативные связи усиливаются при повторении - возможно, са
мы й стары й закон запом инания, известный человеку. Эвристика доступно
сти использует обратную форму этого закона, то есть она использует силу
ассоциации к ак основание для оценки частоты. В этой теории, доступность
является, скорее, переменной-посредником, чем зависимой переменной как
обычно бывает в исследовании пам яти. Доступность - надеж ны й клю ч для
оценки частоты, потому что, часты е события легче вспомнить или вообра
зить, чем редкие. Однако на доступность такж е воздействуют различные
ф акторы , которые не связаны с фактической частотой. Если применяется
эвристика доступности, то такие ф акторы повлияю т на воспринятую часто
ту классов и субъективную вероятность событий. Следовательно, использо
вание эвристики доступности ведет к систематическим предубеждениям.
Эта часть книги исследует эвристику доступности в десяти последователь
ны х исследованиях.26*Сначала мы показы ваем, что люди могут оценивать
доступность с разумной скоростью и точностью. Затем, мы показы ваем, что
оцененная частота классов смещ ается за счет доступности их частных слу
чаев для построения и процесса формирования воспроизведения. Экспери-
О ц ен ки д о сту п н о сти
Исследование 1: Построение
Испытуемым (N = 42) предоставлен ряд задач на построение слов. К аж дая
задача состояла из матрицы 3 x 3 , содержащих девять букв для составле
ния слов из трех букв или больше. В обучающей стадии исследования, всем
испытуемым предоставили шесть задач. На каждую задачу, им давали 7
секунд, чтобы оценить количество слов, которые они могли бы составить за
2 минуты. После каждой оценки, им давали две минуты, чтобы записать (в
пронумерованных строках) столько слов, сколько они могли составить из
букв в матрице. Данные, полученные в обучающей стадии, были исключе
ны. В стадии испытания, построение и задачи оценивания были отделены.
Каждый испытуемый, оценивал для восьми задач количество слов, которое
он мог бы придумать за 2 минуты. Д ля восьми других задач, он составлял
слова без предшествующей оценки. Оценивание и задачи построения чере
довались. Использовались два параллельных стимульных проспекта, что
бы для каждой задачи половина испытуемых оценивала и половина состав
ляла слова.
Результаты. Среднее количество составленных слов варьировалось от 1.3
(для XUZONLCJM) до 22.4 (для TAPCERHOB), с общим средним 11.9. Сред
нее оцененное число варьировалось от 4.9 до 16.0 (для тех ж е самых двух
задач), с общим средним 10.3. Корреляция между оценкой и продуктивно
стью по этим шестнадцати задачам составила 0.96.
Исследование 2: Воспроизведение
Структура и процедура были идентичны исследованию 1, за исключением
характера задачи. Здесь, каж дая проблема состояла из категории, напри
мер, цветы или русские писатели, частные случаи которых необходимо
было вспомнить. Испытуемым (N = 28) давали 7 секунд на то, чтобы оце
нить количество частных случаев, которые они могли вспомнить за 2 мину
ты, или 2 минуты на то, чтобы фактически вспомнить. Как в исследовании 1,
задачи построения и оценивания были объединены в обучающейся стадии
и чередовалось в стадии испытаний.
194 ДОСТУПНОСТЬ
Результаты. Среднее количество случаев варьировалось от 4.1 (названия
городов начинающиеся на букву Ф) до 23.7 (четвероногие животные), с об
щим средним 11.7. Среднее оцененное число варьировалось от 6.7 до 18.7 (для
тех ж е самых двух категорий), с общим средним 10.8. Корреляция между
продуктивностью и оцениванием по этим 16 категориям была 0.93.
Обсуждение
В вышеупомянутых исследованиях, доступность событий могла быть изме
рена общим количеством выбранных или созданных случаев в любой зада
че.3Исследования показывают, что люди могут быстро и точно оценивать
доступность. К ак такие оценки осуществляются? Один вероятный механизм
предложен в работе Боусфилда и Седжевика (Bousfield & Sedgewick, 1944),
которые показали, что совокупное воспроизведение случаев является отри
цательно ускоренной показательной функцией от времени. Испытуемый мог
использовать количество случаев, выбранных в короткий промежуток вре
мени, чтобы оценить количество случаев, которые он мог выбрать в дли
тельный отрезок времени. С другой стороны, испытуемый может оценивать
доступность без явного воспроизведения или построения случаев вообще.
Х арт (H art, 1967), например, показал, что люди могут точно оценивать свою
способность узнавать предметы, которые они не могут вспомнить в тесте на
запоминание парных ассоциаций.
Д о с ту п н о с ть д л я п о с т р о е н и я
Мы обратимся теперь к ряду проблем, в которых испытуемому дают прави
ло для построения случаев и просят оценить их общую (или относительную)
частоту. В этих задачах - к а к в большинстве задач на оценивание, испыту
емый не может создать и перечислить все случаи. Вместо этого, мы предпо
лагаем, он пытается создавать некоторые случаи и оценивает полную часто
ту степенью доступности, то есть в соответствии с оценкой легкости, с кото
рой случаи могут прийти в голову. К ак следствие, классы явлений, случаи
которых легко создать или вообразить, будут восприниматься к а к более ча
стые, чем классы того ж е самого размера, которые менее доступны. Этот
прогноз проверен на оценке частоты слова и на оценке нескольких комби
наторных выражений.
Дорожка в структуре — это линия, которая соединяет элемент в верхней строке с эле
ментом в нижней строке, и пересекает только один элемент в каждой строке.
В какой из двух структур больше дорожек?
Сколько дорожек, по вашему мнению, имеется в каждой структуре?
Исследование 5: Комбинации
Рассмотрим группу из десяти человек, которые должны сформировать ко
митеты из г членов, где г - некоторое число между 2 и 8. Сколько различных
комитетов из г членов они могут сформировать? Правильный ответ на эту
задачу задается биномным коэффициентом (г10), который достигает макси
мума 252 для г = 5. Ясно, что количество комитетов из г членов равняется
числу комитетов из 10 - г членов, потому что любая выбранная группа, ска
жем, из двух членов определяет единственно возможную невыбранную груп
пу из восьми членов.
Согласно нашему анализу интуитивной оценки, однако, комитеты из двух
членов более доступны, чем комитеты из восьми. Во-первых, самая простая
схема построения комитетов - разделение группы на непересекающиеся под
множества. Таким образом, каж ды й с легкостью видит, что существуют
целых пять непересекающихся комитетов из двух членов, но не видит и двух
непересекающихся комитетов из восьми. Во-вторых, комитеты из восьми
членов намного менее различимы, так как их элементы пересекаются; лю
бые два комитета из восьми имеют, по крайней мере, шесть общих членов.
Этот анализ предполагает, что маленькие комитеты более доступны, чем
большие комитеты. В соответствии с гипотезой доступности, поэтому, м а
ленькие комитеты должны казаться более многочисленными.
Четыре группы испытуемых (общее количество N = 118) оценили коли
чество возможных комитетов из г членов, которые могут быть сформирова
ны из десяти человек. Различные группы, соответственно, оценили следу
ющие значения г: 1 и 6; 3 и 8; 4 и 7; 5.
Средние оценки количества комитетов показаны на Рисунке 1, с правиль
ными значениями. Как и было спрогнозировано, оцененная численность ко
митетов уменьшается с их размером.
Следующая альтернативная формулировка той ж е самой задачи была изоб
ретена, чтобы проверить общность результатов:
В рисунке, приведенном ниже, имеются десять станций по маршруту между Стартом и
Финишем. Рассмотрим автобус, который следует по этому маршруту, останавливаясь
точно на г станциях.
198 ДОСТУПНОСТЬ
СТАРТ I I I I I I » I I I 1 ФИНИШ
250
200
150
100
X 90
X
80
г
X 70
X
>о 60
X 50
О
* 40
30
20
10
- I— I— I— I— I— I— ^
2 3 4 5 6 7 8
Размер набора
без -Х и 6 - 0 ____ %
Обратите внимание, что они включают все возможные типы дорожек и, следовательно,
Ваши оценки должны в сумме составить 100%.
• Данные дорожек
о Правильное значение
Ö \
30% .
\ ,
X
S’ \ h
§. 20% -
ч
10%
+ +
бх 5х 4х Зх 2х 1х Ох
Число X в выборке из 6
Обратите внимание, что здесь включены все возможные исходы и, следовательно, ваши
оценки должны в сумме составить 100 %.
Число X в выборке из 6
Д о сту п н о сть в о п р о и зв е д е н и я
В этой главе мы обсуждаем несколько исследований, в которых испытуемо
му сначала предоставляют информацию (например, список имен) и потом
просят, оценить частоту объектов данного типа, которые были включены в
сообщение. К ак и в задачах, исследуемых в предыдущей главе, испытуе
мый не может вспомнить и сосчитать все случаи. Мы предполагаем, что
вместо этого он пытается вспомнить некоторые случаи и оценивает полную
частоту степенью доступности, то есть легкостью с которой случаи прихо
дят на ум. Как следствие, классы, чьи случаи с легкостью вспоминаются,
будут оценены как более многочисленные, чем классы того ж е размера, чьи
случаи менее доступны. Этот прогноз сначала был проверен в исследовании
оцененной частоты категорий...
4 Этот пример был выбран из-за его доступности. У нас нет достаточной причины полагать,
что интуитивные прогнозы биржевых маклеров, спортивных комментаторов, политичес
ких аналитиков или психологов-исследователей менее подвержены предубеждениям.
Доступность: эвристика оценки частоты ... 205
незабываемый. Здесь, субъективная вероятность может зависеть, прежде все
го, от подобия между тем событием и рассматриваемым. Если два события
похожи, то человек ожидает повторение прошлого опыта. Когда несколько
случаев приходят на ум, им придается столько значения, насколько они по
хожи, в существенных особенностях, исследуемой проблеме.
Н асколько уместны отобранные случаи? А нализируя свой прош лый
опыт, клинический психолог вспоминает пациентов, которые подходят дан
ному случаю, - тех, кто предпринимал попытки самоубийства, или тех, кто
похож н а данный случай и совершал попытки самоубийства? С актуальной
точки зрения, конечно, соответствующий класс - такой класс пациентов,
которые подобны, в некотором отношении, данному случаю, и соответству
ю щ ая статистика - это частота попыток самоубийства в классе.
Поиск в памяти может осуществляться по другим правилам. Так к ак
попытки самоубийства - драматическое и чрезвычайное событие, пациен
ты, склонные к самоубийству, вероятно, будут легче запоминаться и вспо
минаться, чем депрессивные пациенты, которые не предпринимали подоб
ных попыток. К ак следствие, клинический психолог может вспомнить па
циентов, склонных к самоубийству, с которыми он сталкивался, и оценить
вероятность попытки самоубийства степенью подобия между этими случа
ями и данным пациентом. Такой подход приводит к серьезным предубеж
дениям. К линический психолог, замечающий, что почти все пациенты,
склонные к самоубийству, которых o r может вспомнить, были угнетены,
может прийти к выводу, что пациент, вероятно, совершит самоубийство,
если он показывает признаки серьезной депрессии. С другой стороны, к л и
нический психолог может сделать вывод, что самоубийство маловероятно,
если «этот пациент не напоминает ему ни одного случая самоубийства, с ко
торым он когда-либо сталкивался». Такое рассуждение игнорирует факт,
что только меньшинство депрессивных пациентов совершает попытку са
моубийства, и возможность, что данный пациент весьма отличен от любого,
с которым он когда-либо сталкивался.
Наконец, клинический психолог мог бы подумать только о пациентах,
которые были к ак депрессивны, так и склонны к самоубийству. Он тогда
оценил бы вероятность самоубийства легкостью, с которой такие случаи,
приходят на ум или степенью, в которой существующий пациент является
репрезентативным этому классу. Это рассуждение, такж е, обладает серьез
ным недостатком. Тот факт, что существует много депрессивных пациен
тов, которые предприняли попытку самоубийства, не свидетельствует от
носительно вероятности, что депрессивный пациент предпримет попытку
самоубийства, и все ж е этот способ оценивания обычен. Несколько исследо
ваний (Jenkins & W ard 1963; Smedslund, 1963; W ard & Jenkins, 1965) пока
зали, что случайность между двумя бинарными переменными такими, как
признак и болезнь оценивается частотой, с которой они происходят взаимо
связано, практически не принимая во внимание случаи, где либо признак,
либо болезнь отсутствовали.
206 ДОСТУПНОСТЬ
Некоторые события воспринимаются настолько уникально, что прошлый
опыт не каж ется уместным при оценке их вероятности. В размышлении о
таких событиях мы часто строим сценарии, то есть, истории, которые ведут
от существующей ситуации к целевому событию. Правдоподобие сценари
ев, которые приходят на ум, или трудность их создания, служ ит ключом к
оценке вероятности события. Если обоснованный сценарий не приходит на
ум, случай считают невозможным или маловероятным. Если на ум прихо
дит много сценариев, или если один придуманный сценарий особенно убе
дителен, рассматриваемый случай каж ется вероятным.
Многие из событий, вероятность которых люди желают оценить, зави
сят от нескольких взаимосвязанных факторов. Все ж е чрезвычайно трудно
для человеческого ума прочувствовать последовательности изменений не
скольких взаимодействующих факторов. Мы предполагаем, что в оценке
вероятности сложных событий рассматриваются только самые простые и
наиболее доступные сценарии. В частности, люди будут склонны создавать
сценарии, по которым большинство факторов вообще не изменяется, при
сутствуют только наиболее очевидные изменения, и взаимодействующие
изменения редки. Из-за упрощенного характера предполагаемых сценари
ев, исходы компьютерного моделирования процессов взаимодействия час
то противоречат интуиции (Forrester, 1971). Тенденция рассматривать толь
ко относительно простые сценарии может иметь особенно существенные
эффекты в ситуациях конфликта. В этом случае, собственное настроение и
планы более доступны, чем планы другого человека. Н елегко принять мне
ние противника по шахматной доске или полю битвы, вот почему посред
ственный игрок обнаруживает так много новых возможностей, когда он
меняет сторону в игре. Следовательно, игрок может иметь тенденцию рас
ценивать стратегию его противника к ак относительно постоянную и не за
висящ ую от его собственных шагов. Эти соображения говорят, что игрок
восприимчив к ошибке инициативы - тенденции приписывать меньше ини
циативы и воображения своему противнику, чем себе. Эта гипотеза согла
суется с выводом поиска приписывания (Jones & N isbett, 1971), согласно
которому люди склонны воспринимать свое поведение к а к отражение из
меняю щ ихся потребностей окружающей среды, а поведение других - как
отражение черт характера.
Создание сценария накладывает отпечаток на дальнейшее мышление.
Существует много сведений, показывающих, что к ак только некоторая си
туация воспринимается или интерпретируется определенным образом, ста
новится чрезвычайно трудно воспринимать ее по-другому (см, например,
B runer & Potter). Таким образом, составление определенного сценария мо
ж ет препятствовать появлению других сценариев, особенно тех, которые
ведут к другим исходам...
Возможно, наиболее очевидное проявление доступности в реальной ж из
ни - это влияние случайной доступности случаев или сценариев. Многие
читатели испытали временное увеличение субъективной вероятности несча
Доступность: эвристика оценки частоты ... 207
стного случая, увидев на обочине перевернутую машину. Подобным обра
зом, многие замечают усиление субъективной вероятности того, что несчаст
ный случай или неполадки оборудования спровоцируют начало термоядер
ной войны после просмотра фильма, ярко описывающего такую возмож
ность. Сосредоточение внимания на исходе, может увеличить его доступ
ность, и, следовательно, его каж ущ ую ся вероятность. Люди увлекаются
желаемыми исходами, такими как выигрыш в тотализаторе или крайне не
ж елательными исходами, к ак крушение самолета. Следовательно, доступ
ность обеспечивает механизм, согласно которому явления крайней полез
ности (или бесполезности) могут происходить более вероятно, чем на самом
деле...
12. Эгоцентрические предубеждения в доступности
и атрибуции*
Дифференциальное воспроизведение
Предубеждение доступности может такж е являться следствием дифферен
циального воспроизведения информации из памяти. При распределении
ответственности за исход совместной деятельности важ ны й вопрос для к а ж
дого участника может звучать так: “Каков мой вклад?” Участники могут
210 ДОСТУПНОСТЬ
попытаться вспомнить собственные вклады и неуместно использовать ин
формацию, полученную таким образом, чтобы оценить их относительные
вклады , однако подобная оценка не может быть сделана должным образом
без рассмотрения входных данных других людей.
Информационные различия
Вероятно, существуют различия в доступной для участников информации,
что может спровоцировать эгоцентрическое вспоминание. Люди имеют боль
ш ий доступ к их собственным внутренним состояниям, мыслям и стратеги
ям , чем наблюдатели. Кроме того, участники общего дела могут отличаться
по знанию частоты и значения независимых вкладов друг друга. Например,
супервизоры факультета могут знать меньше о количестве времени, усили
ях или изобретательности, которую студенты вкладывают в выполнение
заданий, проведение анализов данных и написание предварительных про
ектов работы, чем сами студенты. С другой стороны, супервизоры более ос
ведомлены о количестве и о важности размышлений, чтения и так далее,
которые они включают в исследование прежде, чем студенты начнут его
выполнять.
М от ивационны е вли ян и я
Мотивационные факторы могут такж е привести к эгоцентрическому пре
дубеждению о доступности. Чувство собственного достоинства может уве
личиться, если сосредотачиваться или придавать больше значения, собствен
ным вкладам. Точно так же озабоченность собственной оперативностью или
контролем может привести людей к тому, чтобы уделить больше внимания
собственным вкладам в совместное дело (см. deCharms, 1968; W hite, 1959).
Предшествующее обсуждение выделяет множество процессов, которые
могут работать на то, чтобы представить собственные вклады более доступ
ными (и легкими для вспоминания), чем вклады других. Следовательно,
трудно опровергнуть гипотезу, согласно которой воспоминания и приписы
вания являю тся эгоцентрическими. К ак заметил Гринвалд (Greenwald,
1978), эгоцентрический характер памяти “не является неминуемой прав
дой . Можно предпринять попытку упорядочивания прошлого опыта, напри
мер, провести сопоставительную работу, такую к ак написание текста по
истории или индексирование тезауруса “ (с. 4). Кроме того, нам не удалось
найти опубликованные данные, прямо подтверждающие предполагаемое
предубеждение доступности. Наконец, недавние явления в литературе, по
священной участникам и наблюдателям, каж ется, противоречат гипотезе,
согласно которой воспоминания и приписывания являю тся эгоцентричес
кими. Джонс и Нисбетт (Jones и N isbett, 1971) считали, что участники склон
ны видеть причину своего поведения в окружающей среде, в то время как
наблюдатели приписывают то ж е самое поведение устойчивым чертам ха
Эгоцентрические предубеждения в доступности... 211
рактера, которыми обладают участники. Хотя разнообразие объяснений
этого эффекта было предложено к рассмотрению (Jones и N isbett, 1971), не
давний акцент был поставлен на перцептивной обработке информации
(Storm s, 1973; Taylor и Fiske, 1975). Визуальные рецепторы участника на
целены на окружающую среду; наблюдатель может сосредотачиваться не
посредственно на нем. Таким образом, различные аспекты ситуации суще
ственны для участников и для наблюдателей, неравенство, которое отраже
но в их причинных приписываниях. Это предположение, каж ется, проти
воречит положению, что участники во взаимодействии с другими людьми в
значительной степени погружены в себя.
Два исследования предлагают подтверждение существующей гипотезы.
Роджерс, К уипери Киркер (Rogers, K uiper, K irker, 1977) показали, что чер
ты характера, выраженные прилагательными, вспоминались легче, если
испытуемых просили соотнести их с собой (т.е. описывала ли каж дая черта
их), чем когда их просили о множестве других оценок (например, оценки
синонимичности). Эти данные подразумевают, что возможность соотнесе
ния с собой увеличивает доступность. Однако, Роджерс и др. не противопо
ставляли вспоминание прилагательных, относящихся к себе с вспомина
нием прилагательных, относящихся к другим - сравнение, которое было
бы более подходящ им для текущего обсуждения. Гринвальд и Альберт
(Greenwald, A lbert, 1968) обнаружили, что люди вспоминали, свои собствен
ные вы сказы вания по определенному е опросу более точно, чем письменные
вы сказы вания других испытуемых. Так к ак высказывания самого челове
ка и других людей отражали всегда противоположные точки зрения, Грин
вальд и Альберт подтвердили большую осведомленность и лучшее запоми
нание аргументов, совпадающих с собственной позицией, чем запоминание
само-произведенных утверждений, хотя свидетельство для изучения пре
дубеж дениям сом нительно, нап ри м ер, G reenw ald и S a k u m u ra , 1967;
Malpass, 1969.
Мы провели экспериментальное исследование, чтобы определить, мож
но ли получить подтверждение предполагаемого предубеждения доступно
сти. Студентов старших курсов, посещающих семинар, попросили оценить,
сколько минут каж ды й участник семинара говорил в течение прошедшего
занятия. Дополнительно были отобраны 26 испытуемых из групп по два че
ловека, к которым подходили в кафетериях и залах. Участников в этих груп
пах попросили оценить процент полного времени, в течение которого к а ж
дый человек говорил в течение текущего взаимодействия.
Предполагалось, что испытуемые будут основывать свои оценки време
ни на частях беседы, которые они могли с легкостью вспомнить. Таким об
разом, если имеется предубеждение в пользу вспоминания собственных ут
верждений, оценки человеком количества времени, в течение которого он
сам говорил, должны превысить среднее время говорения, приписанное ему
другими членами группы.
212 ДОСТУПНОСТЬ
Результаты подтвердили предположения. Д ля семи из восьми студентов
на семинаре старшекурсников, оценки их собственного времени говорения
превысили среднюю оценку времени, приписанную им другими участни
ками (р < 0.05, тест знаков). Точно так ж е оценки собственного времени раз
говора у 10 из 13 пар превысили оценки времени, данные другими участни
кам и (р < 0.05, тест знаков). Величина предубеждения была существенной
для 13 пар, F (1, 12) = 14.85, р <0.005; в среднем участники оценили, что
они говорили 59% времени. Эти данные обеспечивают предварительные,
хотя и косвенные, подтверждения предполагаемого предубеждения доступ
ности в ежедневных ситуациях...
Э ксперим ент 1
В этом эксперименте, мы хотели исследовать эгоцентрические предубежде
ния в естественно складываю щ ихся, длительных отношениях. Ж енатые
пары представляли идеальную целевую группу. Супруги участвуют во мно
гих совместных делах различной важности. Это обстоятельство должно пре
доставлять возможности для эгоцентрических предубеждений.
Соответственно, первый эксперимент проводился (а) чтобы определить,
происходят ли эгоцентрические предубеждения в распределениях ответ
ственности в брачных отношениях; (Ь) чтобы воспроизвести, используя раз
личную меру зависимости, эгоцентрическое предубеждение доступности,
полученное в предварительных испытаниях; и (с) чтобы соотнести преду
беждение доступности с предубеждением в ответственности. Если предубеж
дение в ответственности вызвано предубеждением доступности, два набора
данных должны быть связаны.
М ет од
Р езульт ат ы
Ответы обоих супругов на каж ды й из вопросов об ответственности были сум
мированы так, чтобы общее количество включило то значение, которое жена
рассматривала к ак ее вклад, и то количество, которое муж рассматривал
как его вклад. Так как ш кала ответа была 150 миллиметров длиной, было
размещено 150 “единиц ответственности”. Сумма больше, чем 150 указы
вала на эгоцентрическое предубеждение в каж ущ емся вкладе, — то, что, по
крайней мере, один из супругов переоценивал свою ответственность за эту
деятельность. Чтобы оценить степень пере- или недооценки, которую этот
супруг показал для каждого вида деятельности, 150 вычиталось от общей
суммы каждой пары. Общий счет был получен для пары в среднем по 20
действиям (или 19, когда у пары не было детей).
Дисперсионный анализ, использующий пару как единицу анализа, по
казал, что общий счет был значительно больше нуля, М = 4.67, F (1, 35) =
12.89, р < 0.001, указы вая эгоцентрическое предубеждение в воспринятых
вкладах. Двадцать семь из 37 пар показали некоторую степень переоценки
(р < 0.025, тест знаков). Более того, в среднем, переоценка произошла в 16
из этих 20 пунктов в анкетном опросе, вклю чая отрицательные пункты -
например, причина споров между вами, F (1, 32) = 20.38, р < 0.001. Хотя
величина переоценки была относительно маленькой, в среднем, испытуе
мые имели тенденцию использовать ограниченный диапазон ш калы . Боль
шинство ответов были слегка выше или слегка ниж е середины ш калы . Ни
один пункт не показал существенный эффект недооценки.
Э ксперим ент 2
В эксперименте 2 мы попросили игроков из 12 университетских сборных
баскетбольных команд индивидуально заполнить анкетный опрос, в кото
ром было необходимо вспомнить важ ны й поворотный момент в их после
дней игре и оценить, почему их команда выиграла или проиграла.
Это возможность уйти от сравнений сам-другой, которые мы рассмотре
ли в предыдущих исследованиях, к сравнению команда - другая команда.
Существует, однако, множество причин ожидать, что действия собственной
команды должны быть более доступны наблюдателям, чем действия дру
гой команды: я знаю имена моих товарищей по команде, и поэтому, у меня
есть готовые средства для организации хранения и выборки данных, соот
ветствующих им; наш успех в будущих играх с другими противниками за
висит больше от наш их собственных наступательных и защитных способ
ностей, чем от способностей противостоящей команды. Следовательно, я
Эгоцентрические предубеждения в доступности... 215
могу внимательнее следить за действиями моих товарищей по команде, что
облегчает кодирование и хранение. Также, имеются информационные раз
личия: стратегии собственной команды более существенны, чем стратегии
противостоящей команды (Tversky и Kahneman, 1973,11). Если инициати
вы собственной команды дифференциально доступны, игроки должны
вспомнить поворотный момент в терминах действий своей команды и при
писать ответственность за исход игры своей команде....
М ет од
Результ ат ы
Не было обнаружено никаких существенных половых различий в двух за
висимых измерениях, поэтому о результатах сообщается независимо от пола.
Так к ак ответы членов команды не могут рассматриваться к ак независи
мые, было подсчитано среднее значение ответов, и команда, служила как
единица анализа.
216 ДОСТУПНОСТЬ
Предварительная проверка данных “поворотного момента” показала, что
даж е в пределах команды игроки вспоминали весьма различные события.
Однако 119 игроков вспомнили поворотный момент, который они описали
к а к созданный действиями их собственной команды; 13 игроков вспомни
ли поворотный момент, который они рассмотрели, к а к вызванный обеими
командами; 16 игроков вспомнили, поворотный момент, который, к ак им
казалось, инициирован действиями противоположной команды (оставши
еся 10 игроков не ответили на вопрос). Испытуемые описали такие события
к а к сильную защ иту в течение последних 2 минут игры, изменение в насту
пательны х стратегиях, и так далее.
Процент игроков, которые вспомнили поворотный момент, к ак вызван
ный членами их команды, был получен для каждой команды. Эти 12 мно
жеств были подвергнуты анализу, в котором они сравнивались со случай
ным ожиданием 50% . Полученное распределение сильно отличалось от слу
чайного, F (1,11) =30.25, р < 0.001, со средним 80.25% . К ак и было предпо
ложено, большинство сообщений выделяли действия собственной коман
ды.
Процент игроков, которые вспомнили поворотный момент, к а к вызван
ный членами их команды, был исследован относительно игры команды.
Средний процент был выше у проигравшей команды, чем у победившей в
пяти из шести игр (р < 0.11, тест знаков). Средняя разница между процен
тами проигравших (М = 88.5) и выигравш их (М =72) команд была незначи
мой (F <1).
Бы ли такж е исследованы объяснения игроков относительно победы или
проигрыш а их команды. Из 158 участников, только 14 указали причины,
которые вклю чали действия противостоящей команды. В среднем, испы
туемые сообщили о 1.79 причинах, касающиеся собственной команды и 0.09
п р и ч и н , к а саю щ и х ся п роти воп олож н ой ко м ан д ы , F (1, 11) = 2 7 2 .9 1 ,
р < 0.001. Наконец, тенденция приписывать больше причин для собствен
ной команды была незначительно большая после проигрыша (М= 1.73), чем
после победы (М= 1.65), F < 1.
Обсуждение
Ответы н а вопрос о поворотном моменте указывают, что действия товари
щ ей по команде испытуемых были более доступны, чем действия членов
противостоящей команды. Далее, испытуемые приписывали ответствен
ность за исход игры действиям или бездействию скорее своих товарищей по
команде, чем членов противоположной команды. Таким образом, предубеж
дения в доступности и оценки ответственности могут происходить на уров
не групп. Ратер и Хесковиц (R ather, Heskowitz ,1977) приводят другой при
мер группового эгоцентризма: “CBS (новости) стали лидером после запуска
на Луну Апполона в 1968. Если Вы - сотрудник CBS, Вы склонны считать,
что ваше описание приземления на Луну перевернуло наше воприятие. Если
Эгоцентрические предубеждения в доступности... 217
Вы - сотрудник NBC, Вы склонны рассматривать раскол команды Хантли-
Бринк ли(НшШеу- Brinkley) к ак ключевой фактор “ (с. 307)....
Э ксперим ент 3
М етод
В одной из форм анкетного опроса испытуемых просили указать свой собственный вклад
в каждое и з множества действий, связанных с их бакалаврскими дипломами. Вопросы
были следующие: (а) “Я п р едл ож и л __ процентов методологии, которая в конечном
итоге использовалась в исследовании.” (В) “Я обеспечил _ процентов интерпретации
результатов.” (С) “Я был инициатором__ процентов обсуждений, касающихся дипло
ма, с моим руководителем.” (D) “В течение связанных с дипломом обсуждений я был
склонен управлять курсом и содержанием обсуждения__ процентов времени.” (Е) “Учи
тывал все, я был ответствен з а ___ процентов всех усилий, приложенных к исследова
нию.” (F) “Как бы Вы оценили Ваш диплом относительно других дипломов, сделанных
на факультете? “
Вторая форма анкетного опроса была идентична вышеупомянутой, за исключением
218 ДОСТУПНОСТЬ
того, что слово Я (условие направленности на себя) было заменено на м ой р у к о в о д и т е л ь
(условие направленности на руководителя) в вопросах 1-5. Испытуемых попросили за
полнить бланки с ответами на первые пять вопросов и провести косую черту через 150-
миллиметровую линию, с концами, помеченными “х уж е” и “лучше”, в ответ на вопрос
6.
Р езульт ат ы и обсуждения
С целью анализа, было принято, что вклад руководителя и студента в к аж
дый пункт составляет в целом 100% . Хотя эксперимент был представлен
к а к изучение отношения студент-руководитель, возможно, что студенты
рассматривали в своих оценках входные данные других людей (например,
других студентов). Однако данная процедура обеспечивает умеренное ис
пытание экспериментальной гипотезы. Например, если тестируемый отве
чал 20 % на пункт в “Я ”-версии анкетного опроса, считалось, что его или ее
руководитель внес вклад 80% . Руководитель, возможно, внес только 60%,
а неизвестный человек остальные 20% . Возможно переоценивая вклад ру
ководителя, однако, мы смещаем данные против экспериментальной гипо
тезы: “Я”- версия, к а к ожидалось, уменьшит процент ответственности, при
писываемой руководителю.
Ответы испытуемых на первые пять вопросов в “Я”-версии анкетного оп
роса вычитались из 100 так, чтобы более высокие числа отражали большие
вклады руководителя в обоих условиях. Вопрос 5 имел дело с полной ответ
ственностью за исследование. Как и ожидалось, испытуемые приписали боль
ше ответственности руководителю при условии направленности на руково
дителя (М = 33.3 %), чем при условии направленности на себя (М = 16.5 %),
F (l, 27) = 9.05, р < 0.01. Первые четыре вопроса касались различных аспек
тов диплома, и средний ответ показал похожие результаты: направленность
на руководителя М = 33.34; направленность на себя М = 21.82; F (1,27) =5.34,
р < 0.05. Наконец, испытуемые имели тенденцию оценивать свой диплом бо
лее положительно при условии направленности на себя, чем при условии на
правленности на руководителя: 112.6 против 94.6, F (1, 27) = 3.59, р < 0.10.
Контрастирующая формулировка вопросов имела ожидаемое воздействие
на распределения ответственности. Версия анкетного опроса, касающ аяся
руководителя, возможно, заставила испытуемых вспомнить, большую часть
вкладов их руководителей, чем “Я”-версия анкетного опроса. Эта диффе
ренциальная доступность была отражена в распределениях ответственнос
ти. Обратите внимание, что вопросы не поддавались контролю испытуемых
за счет исправлений. Научному руководителю приписывалась только тре
тья часть ответственности за диплом в условии направленности н а руково
дителя.
В свете существующих данных, приписывания баскетболистов ответ
ственности за исход игры в эксперименте 2 должны были быть заново ис
следованы. Вспомните, что игроков просили закончить предложение, “Наша
Эгоцентрические предубеждения в доступности... 219
команда выиграла / проиграла последнюю игру потому что... ” Этот вопрос
выдал высоко значимое эгоцентрическое предубеждение. Оценивая прошлое
испытание, очевидно, что форма вопроса - “Наша ком анда... нашу прошлую
игру” — , возможно, побудила испытуемых сосредоточиться на действиях
их собственных команд, даже при том, что формулировка не устраняет ссыл
ки на противоположную команду. Вопрос про “поворотный момент” в экс
перименте 2 был более нейтрально сформулирован и не может интерпрети
роваться двояко.
Главные вопросы в этих исследованиях исходят из внешнего источника;
многие из наших вопросов исправления само-инициированы, однако, и наше
вспоминание может вполне быть смещено формой, в которой мы самим себе
излагаем вопросы исправления. Например, баскетболисты, скорее всего,
будут думать в терминах “Почему мы выигрывали или проигрывали? “ Чем
в терминах, сформулированных нейтрально “К акая команда была ответ
ственной за исход игры?”...
Настоящее исследование демонстрирует распространенность центриро
ванных на себе (self-centered) предубеждений доступности и оценок ответ
ственности. В повседневной ж изни, эти эгоцентрические тенденции могут
не замечаться, когда объединенные усилия не требуют явных распределе
ний ответственности. Если распределения обозначены отчетливо, однако,
появляется повод для разногласия, и люди, вряд ли, поймут, что различия
в оценках могут исходить из оценок информации, которая является диффе
ренциально доступной.
13. Предубеждения доступности в социальном
восприятии и взаимодействии*
Ш е л л и И . Т ей лор
В ы вод ы
Н есколько прош едш их десятилетий изменили точку зрения на оценки как
результаты рационального, логического принятия реш ения, искаж енного
случайным присутствием иррациональны х потребностей и мотивов к рас
смотрению человека к ак пользователя эвристики. Эмпирическая работа над
не-социальными оценками показы вает, что субъект использует сокращ е
ния или эвристику, чтобы освободить место и передавать информацию на
столько быстро, насколько возможно, и недавние исследования в области
социальной психологии предполагает, что эти процессы такж е обращ аются
к формированию и использованию социальных оценок. Л егкость, с кото
рой примеры или ассоциации приходят в голову, обеспечивает оценку по
добия (то есть, частоту или вероятность), которая в свою очередь обеспечи
вает основание для создания других социальных оценок, таких к ак оценки
другого человека, причинная атрибуция или приписывание ответственнос
ти, описание признаков другого человека, отнесение других людей к кате
гории или описание себя.
Н аблю дательный критик обратит внимание, что в представленных ис
следованиях свидетельство для использования эвристики доступности яв
ляется скорее логически выведенным, чем прямы м, и можно требовать бо
лее ясного свидетельства, что именно легкость, с которой примеры или ас
социации приходят в голову, ф актически опосредует оценки. Имеются не
сколько причин для неопределенности. Во-первых, в отличие от когнитив
ного исследования доступности, ни одно из этих социальных исследований
не было предназначено для исследования доступности к ак таковой; скорее,
каж дое было предназначено, чтобы объяснить некоторое интересное соци
альное явление, и эвристика доступности применялась к ак одно из несколь
ких возмож ны х объяснений явления. Во-вторых, не существует пока еще
согласованного измерения доступности. Некоторые исследования исполь
230 ДОСТУПНОСТЬ
зовали скорость, с которой информация восстановливается в пам яти как
меру доступности (см. Pryor& K riss, 1977), в то время к ак другие исследова
н ия рассматривали объем вспомненной информации как коэффициент дос
тупности информации (см. Ross & Sicoly, 1979,12). Так к ак эти две меры не
всегда хоропхо коррелирую т (см. P ryor и K riss, 1977), двусмысленность и з
мерения препятствовала эмпирическому прогрессу.
Часть этой проблемы измерения, однако, является спорной из-за третьей
проблемы, а именно, концептуальной двусмысленности, касаю щ ейся ис
пользования термина доступность. И меется тривиальны й смысл, в кото
ром весь социальный вывод обусловливается доступностью; оценки всегда
основаны на том, что приходит на ум. Это использование термина доступ
ность должно отличаться от использования эвристики доступности с помо
щью ясны х критериев для определения, действительно ли эвристика дос
тупности бы ла задействована и к ак она была задействована, и действитель
но ли доступность примеров или ассоциации является посредником после
дующ их оценок. Социальные психологи имели тенденцию сосредотачивать
ся на том, какая инф ормация является доступной и почему; увеличение
масш табов социального объяснения требует перенаправления усилий на то,
как эвристика доступности связы вает содержание того, что является дос
тупным когнитивной обработке.
Влияние концепции доступности на социальную психологию, тем не ме
нее, было большим по нескольким причинам. Во-первых, она вы двигает на
первы й план ош ибки в обработке, которые могут быть поняты , не обращ а
ясь к мотивационным конструкциям . Это не говорит о том, что воздействие
мотивов на оценки незначительно, но просто указы вает на то, что главны е
ош ибки в познании такж е существуют. Во-вторых, хотя рациональные тео
рии обеспечили полезные нормативные модели, с которыми ф актические
суж дения могут быть сравнены, отклонения от этих моделей настолько обыч
ны и явны , что необходимы описательные модели. В примерах, приведен
ны х здесь, такж е к ак во многих других, эвристика доступности обеспечила
одно из возмож ны х описаний. При некоторых обстоятельствах, использо
вание эвристики доступности приводит к уместным заклю чениям; однако,
при тех обстоятельствах, где имеется предубеждение относительно того,
к а к а я инф ормация является доступной, следуют лож ные выводы. Опреде
ленно, предубеждения заметности, предубеждения воспроизведения и пре
дубеж дения, возникаю щ ие из-за познавательны х структур, таких к ак схе
мы , убеж дения и ценности, могут приводить к повыш енной доступности
неправильной или вводящ ей в заблуждение информации в задачах соци
альны х оценок.
У читы вая, что предубеждения доступности могут быть весьма распрост
ранены , почему ж е используется эвристика доступности? Одна из очевид
ны х причин - то, что она производит больше правильны х, чем неправиль
ны х ответов, и в смысле затрат/вы годы , она имеет преимущ ество, экономя
время и энергию . Второй ответ - то, что многие ош ибки в выводах, произве
Предубеждение доступности в социальном ... 231
денных эвристикой доступности, не будут иметь значение. Например, если
искаж енны е впечатления не повлияю т на будущее функционирование, к ак
при формировании неправильного впечатления о человеке, который встре
чается только один раз, предубеждение будет иметь мало значения. Преду
беждение доступности мож ет иметь мало значения, если оно постоянно в
течение некоторого времени. Н апример, если Вы расцениваете руководите
ля к ак грубияна, не имеет значения то, что он грубый только когда, нахо
дится в этой роли, если это единственное обстоятельство, при котором чело
век взаимодействует с ним. Третий ответ - то, что многие ошибки могут быть
исправлены . Если предубеждение доступности не исчезает само со време
нем, процесс начнет еамоисправляться с каж ды м новым случаем. Н апри
мер, если несколько друзей одного человека недавно развелись, оценка про
порции развода может быть временно преувеличена, но если друзья не про
должаю т разводиться, оцененная пропорция развода долж на, в конечном
итоге, совпасть с объективными данными. Н аконец, в некоторых случаях,
ош ибка будет обнаружена по средством общ ения. Н апример, если утверж
дение, что человек сделал некоторую часть работы по дому, сталкивается с
серьезными возраж ениями со стороны супруга (супруги), то позиция, веро
ятно, будет изменена. Короче говоря, обычное социальное общение обеспе
чивает основание для испы тания выводов, и очевидно лож ные заклю чения
с далеко идущ ими значениями, вероятно, будут исправлены.
Но ошибочное восприятие с серьезными последствиями, при некоторых
обстоятельствах могут сохраняться. Н апример, к ак исследования стерео
типов иллю стрирую т, если имеется предубеждение в формировании суж
дения, это может, в свою очередь, привести к предубеждениям в сохране
нии этой оценки с помощью сформировавш ейся познавательной структуры
(в этом данном случае, стереотипа). Эти “сопутствующие” или дополняю
щ ие друг друга предубеждения могут быть высоко устойчивыми к опровер
жению . Существуя, они могут иметь разруш ительное влияние к ак на инди
видуальны е восприятие, так и на социальную политику. Короче говоря,
нельзя считать предубеждения доступности несущ ественными, и соответ
ственно, необходимы стратегии для обнаружения и исправления искаж ен
ны х выводов.
14. Эвристика моделирования*
Кат егории от вет а Версия "времени” Версия "м арш рут а "
(1) маршрут 8 33
(2) время 16 2
(3) пересечение 19 14
перекрестка
(4)мальчик 18 13
(5) другое 1 3
*Мы хотим поблагодарить профессоров Даниела Канемана, Амоса Тверского и Пола Слови-
ка за их полезные комментарии и предложения. Мы также хотели бы отметить большие
усилия Риты Френч и Джулии Стейнмец, которые принимали участие в исследовании, о
котором сообщается здесь. Исследование было поддержано частично стипендией Нацио
нальной научной организации первому автору, грантом Национального института психи
ческого здоровья МН-26736 и грантом Национальной научной организации BNS-78-01211
Ли Россу и Марку Лепперу.
Организация и содержание этой главы появились благодаря более раннему исследованию
этой же темы Л. Россом и Р. X. Нисбеттом в книге “Предположения людей: Стратегии и
недостатки социальных оценок” (Human Inference: Strategies and Shortcomings of Social
Judgment), Prentice-Hall, Inc., 1980.
+Ковариация - (от англ, covariation) совместная изменчивость, взаимосвязь переменных
величин (прим, редактора).
244 КОВАРИАЦИЯ И КОНТРОЛЬ
Перед тем, к ак начать обсуждение прошлого или настоящего исследова
ния, мы должны обратить внимание, что каждодневное наблюдение обеспе
чивает нас большим количеством данных; и это наводит на мысль, что ответ
на вопрос об опыте может быть далеко не простым. С одной стороны, и адап
тивный характер социального поведения, и гармоничное качество социаль
ного взаимодействия не оставляет сомнений в том, что представители нашей
культуры обладают глубокой проницательностью относительно причин и
последствий поведения. Ф актически, современные теоретики атрибуции (на
пример, Jones и др., 1971; Kelley, 1967, 1971,1973; W einer, 1974), которые
интересовались основаниями для такой проницательности, рассматривали
способность обнаружить ковариацию и перешли к логическому использова
нию таких воспринятых ковариаций. С другой стороны, каждодневный опыт
такж е предлагает красноречивое доказательство существования необоснован
ны х предубеждений, разрушительных поведенческих стратегий и других про
явлений ошибочных причинных или корреляционных теорий. Очевидно, что
любое адекватное описание неофициальной оценки ковариации должно зат
рагивать неоднородность поведения обывателя. Это должно, так или иначе,
урегулировать тонкую проницательность относительно некоторых функци
ональных отношений и невежество или иллю зии о других.
Э к сп ер и м ен тал ьн о е ср ав н е н и е о ц ен ок к о в а р и а ц и и , о сн о в ан н ы х н а
данн ы х и на теори ях
Объективная корреляция
Эллен Й. Лангер
М ет од
Р езульт ат ы
Перед исследованием, действительно ли количество поставленных на кон
денег варьировалось к ак ф ункция компетентности противника, важ но удо
стовериться, что противник был действительно воспринят по-разному в двух
условиях. Средняя оценка компетентности противника была 4.8, при усло
вии противник-щ еголь, и 3.17 при условии растяпа. П рактически не было
пересечений меж ду двумя условиями. Различие меж ду двумя средними
значениями значительно (t = 5.46, р < 0.005). Поэтому, можно сказать, что
испытуемые при условии противник-щ еголь видели себя конкурирую щ и
ми против более компетентного человека, чем испытуемые в условии растя
па.
Давайте вспомним, что испытуемые могли делать ставки в размере от 0
до 25 центов в каж дом из четырех раундов пари. Эти четыре ставки были
усреднены, чтобы дать отдельный счет для каждого испытуемого. Средняя
ставка для испытуемых при условии противник-щ еголь была 11.04 цента
по сравнению с 16.25 центов для испы туемы х в условии растяпы (t = 2.39,
р < 0 .0 2 5 ). Различием еж ду этими двумя группами должно быть даже более
очевидно, когда мы исследуем первые сделанные ставки, так к ак первый
тур пари наиболее близко соответствовал экспериментальной манипуляции.
270 КОВАРИАЦИЯ И КОНТРОЛЬ
Средняя первая ставка для условия противник-щ еголь была 9.28, в то вре
м я к а к средн яя п ервая ставка для условия растяпы бы ла 16.72 (t = 3.16,
р < 0.005).
Концептуальное испытание манипуляции. Чтобы проверить предположе
ние, что испытуемые из Йельского университета ожидают, что привлекатель
ны й противник поставит больше, чем непривлекательный, две анкеты были
предъявлены случайным выборкам старш еклассников Йельского универси
тета. В первой анкете были описаны задача и участники, и испытуемых спро
сили, кто, к ак они думали, поставит на кон больше. Двенадцать из 16 испы
туемых предположили, что привлекательный человек поставит на кон боль
ш е (хг —4, р < 0.05). Во второй анкете описывалась задача, и у людей спроси
ли, сколько бы они поставили на кон при каждом испытании. Все 15 человек
опрошенных испытуемых ответили - максимальную ставку (25 центов).
М ет од
Испытуемые. Билеты лотереи были доступны служащим офиса мужского и женского
пола, которые работали в одной из двух фирм, расположенных в Лонг-Айленде, стра
ховом агентстве и производственной компании.1 Так как различные розыгрыши и
спортивные фонды были не редкостью в этих офисах, оправдания для проведения дан
ной лотереи были не нужны. За исключением четырех женщин, все служащие, к кото
рым подходил агент, распространяющий лотерейные билеты, купили билет. Испытуе
мых наугад разделили на группы так, что в итоге было 24 мужчины и 3 женщины в
условии выбора и 23 мужчины и 3 женщины в условии без выбора.
Р езульт ат ы
К ак было спрогнозировано, м анипуляция выбора имела значительное вли
яние на цену билета лотереи. Среднее количество денег, за которое испы
туемы й хотел продать свой билет было $ 8.67 в условии вы бора, и только
$ 1.96 в условии без выбора (t = 4.33, р < 0.005). Х отя их спраш ивали, за
сколько они продадут свой билет, а не, хотят ли они его продать, 15 испыту
емых первоначально ответили, что они его не продают. Из них 10 испытуе
мы х были в условии выбора и 5 - в условии без выбора (р < 0.10). Упомяну
тое различие не являлось просто функцией сумм, указанны х этими испы
туемыми после понуж дения, так к ак их ответы располагались от $ 3 до пол
ной суммы вы игры ш а в $ 53, причем только 3 испытуемых были в после
дней категории.
272 КОВАРИАЦИЯ И КОНТРОЛЬ
Не будучи особенным образом проверенным до последующего исследо
вания, один из результатов, полученных в этом исследовании, касается вли
ян и я осведомленности на иллю зию контроля. Ж енщ ины не столь знакомы
ми с игрой в футбол, к ак мужчины. Следовательно, менее вероятно, что они
согласятся играть в лотерею, а если они все ж е согласятся, они долж ны тре
бовать меньш его количества денег, за свой билет. Н ужно вспомнить, что
только 4 человека отказались участвовать в лотерее, и что все они были ж ен
щ инами. И з шести ж енщ ин, которые согласились участвовать в лотерее,
четы ре попросили $ 1, и две попросили $ 2 за свои билеты. Таким образом,
средняя сумма для ж енщ ин была $ 1.33,посравнению с $ 5.89 для мужчин
(t = 2.14, р < 0 .0 5 )....
В ы вод ы и и х зн а ч е н и е д л я п р а к т и к и
Н а основе только что предоставленных сведений, каж ется, что испытуемые
не отличаю т событий, определенных случаем, от событий, определенных
навы кам и так, к ак предложено их определениями. Объективное непредви
денное обстоятельство не является критической переменной, определяющей
поведение испытуемых. Вместо этого, они реагирую т на событие так, к ак
будто оно является управляемы м, в значительной степени зависит от ф ак
торов таких к ак конкуренция, выбор, знакомство с ситуацией и вовлече
ние, которы е могут быть ортогональными по отношению к ф актическому
непредвиденному обстоятельству. К ак было показано, это очень важ но даже
в ситуациях, которые управляю тся случаем, таких к ак лотерея....
Почему это происходит? Люди заинтересованы в том, чтобы управлять
своей окруж аю щ ей средой. Важность контроля в этом контексте ш ироко
обсуждалась как психиатрами, так и исследователями в области социальных
наук. Рассматривается ли это к ак потребность в компетентности (W hite,
1959), инстинкт обладания (H endrick, 1943), стремление к превосходству
(A d ler, 1930) и ли стрем лен и я к личной причинной обусловленности
(deCharm s, 1968), большинство социологов согласны с тем, что человек за
интересован в том, чтобы управлять своей окружаю щ ей средой, и полная
власть вклю чила бы способность “победить случай”, то есть управлять слу
чайны ми событиями. Чем труднее проблема, тем более компетентным чув
ствует себя человек в способности реш ить ее. Поэтому самое большое удов
летворение или чувство компетентности следовали бы из способности уп
равлять тем, что не поддается контролю ....
В дополнение к заинтересованности в управлении, сущ ествует другая
причина для отсутствия различения между управляемыми и не поддающи
м ися контролю событиями. Это то, что навы к и случайные факторы близко
связаны в опыте людей. То есть существует не только заинтересованность в
том, чтобы не различать их, но и сущ ествует трудность в различении, так
к ак в каж дой ситуации навы ка присутствует элемент случая, и элемент
навы ка присутствует почти в каж дой ситуации случая. Первое, очевидно и
Иллюзия контроля 273
не нуж дается ни в каком дальнейш ем объяснении. Примеры второго - это
знание того, какую ставку лучш е сделать в игре в кости (то есть, знание ве
роятности) или знание, каки е игорные автоматы могут дать самый высо
кий вы игры ш ....
17. Результаты тестов - такие, какими Вы их себе
представляете*
С о б ств ен н ая л и ч н о с ть
Н аш е недавнее исследование говорит, что тесты Рорш аха и ТРЧ могут быть
проективны ми более, чем в одном направлении. В интерпретации резуль
татов этих тестов, среднестатистический клинический психолог может про
ектировать свои собственные предубеждения и предположения в свое опи
сание пациента.
*Эта книга первоначально появилась в Psychology Today, ноябрь 1971, стр. 18-22,106-110.
Авторское право ©. 1971 Ziff-Davis Publishing Со. Переиздано в соответствии с разрешени
ем.
Результаты тестов... 275
Н аш и первые исследования в этой области были с рисуночным тестом, в
котором клинический психолог дает испытуемому карандаш и чистый лист
бумаги и просит, чтобы он нарисовал человека. К арен М ачовер (K aren
M achover) издала этот тест в 1949. Она описала рисунки, обычно нарисо
ванны е людьми с различны ми эмоциональными проблемами, и объяснила,
к ак интерпретировать несколько характеристик рисунков к ак клю чей к
индивидуальности. Она сказала, например, что “человек, больной параной
ей, придает много графического акцента глазам ”, и “человеку того пола, у
которого нарисована голова большого размера предоставлена больш ая ин
теллектуальная и социальная власть”.
Руководство к тестам М аховер отмечено далеко идущ ими обобщениями
относительно того, какие виды людей рисуют каки е виды рисунков, но она
представила очень мало подтверждаю щ их данных.
Ч асти тел а
Н екоторые клинические психологи не ж елали принимать на веру работу
Мачовер; они проверили ее утверж дения экспериментально. Ж ю ль Холз-
берг (Jules H olzberg) и Мюррей Векслер (M urray W exler), например, пробо
вали определить, действительно ли люди, больные паранойей, лучш е про
рисовывают глаза. Они сравнили рисунки 18 пациентов, больных паранои
дальной ш изофренией и 76 студентов, обучаю щ ихся на медсестер, но не
наш ли никакого различия в том, к ак эти две группы рисовали глаза.
М ножество подобных исследований проверили прогнозы М аховер отно
сительно других рисуночных характеристик - головы, уш ей, губ, волос,
одежды, рта, и т.д., — но снова и снова признаки ТРЧ не были подтвержде
ны. Н есколько экспериментаторов обнаружили, что более уравновешенные
испытуемые имеют тенденцию рисовать более полные рисунки, но главное
заклю чение из данны х исследования - то, что определенное содержание
рисунка не валидны й показатель характеристик личности.
П р и зн а к
Необходимо указать, что этот тип исследования не требует совершенной
дискриминации. Если 50 процентов гомосексуалистов рисуют фигуры од
ним способом, и только 25 процентов других людей рисует фигуры этим ж е
способом, характеристика рисунка может все еще рассматриваться как ва
лидны й диагностический признак, так к ак в конечном счете, он может вне
сти информацию к диагнозу гомосексуализма.
Больш инство клинических психологов знает об исследованиях, показы
ваю щ их, что признаки ТРЧ недействительны, все ж е многие ты сячи про
должаю т использовать тест регулярно, потому что они заявляю т, что при
знаки работают в их собственной клинической практике. “Я буду скорее
доверять своим собственным чувствам, чем некоторой статье из ж урнала”, -
276 КОВАРИАЦИЯ И КОНТРОЛЬ
сказал один клинический психолог. “Я знаю , что больные паранойей, к а
ж ется, не рисую т большие глаза в исследовательских лабораториях, - ска
зал другой, - “ но они точно рисуют их в моем кабинете”.
И л л ю зи я
Некоторые кри тики говорят, что клинические психологи так захвачены
своими теориями и традициями, что они не замечают фактов. Мы думаем,
что сущ ествует другое объяснение. Клинический психолог, который про
долж ает доверять ТРЧ, даж е если ему представить очевидные опроверже
н ия, мож ет испы ты вать ложную корреляцию, явление, которое мы обнару
ж или несколько лет назад в исследовании относительно словесных ассоци
аций.
Мы обнаружили, что слова, которые тесно связаны друг с другом, замеча
ются вместе чащ е чем, это действительно бывает. В этих экспериментах ис
пытуемый сидел на удобном стуле, в то время, к ак мы проектировали раз
личны е пары слов (например, бекон — тигр) на большой экран перед ним.
Пары слов менялись каж ды е две секунды. Слово с левой стороны пары было
всегда одно из четырех возможных слов: бекон, лев, бутоны или лодка. К аж
дое слово появилось так ж е часто, как любое другое (25% ), но оно оказы ва
лось всегда на левой стороне экрана. Слово на правой стороне пары было яйца,
тигр или тетрадь с равной вероятностью появления.
Мы систематизировали пары слов так, чтобы каж дое слово с левой сто
роной появилось равное количество раз с каж ды м словом с правой сторо
ной. Н апример, когда слово бекон появлялось на левой стороне, слово яйцо
было в паре с ним в одной третьей части испы таний, тигр в другой трети
испы таний, а тетрадь — в оставш ейся трети. Но когда мы позж е спросили
испытуемых относительно пар слов, они сказали, что, когда слово бекон
появлялось слева, слово яйца ш ло с ним в паре 47% от времени, и что, когда
лев был слева, тигр был тем словом, которое наиболее часто появлялось
справа. Д аж е при том, что каж дая пара слов появлялась так ж е часто, как
лю бая другая, испытуемые заявляли , что пары с сильной вербальной ассо
циацией появлялись более часто, чем другие.
Мы назвали тенденцию видеть две вещ и, появляю щ имися вместе более
часто, чем они ф актически появляю тся, ложной корреляцией.
Видимо, имеется существенное подобие между студентами, которые за
являю т, что некоторые слова появляю тся вместе чащ е, чем на самом деле, и
клиническим и психологами, которые утверждаю т, что видели валидность
в признаках теста ТРЧ, когда исследование говорит, что ее нет.
И н терп ретац и я
П ризнаки ТРЧ и интерпретации могут отличаться сегодня от того, каким и
они бы ли, когда М аховер представила тест, более чем 20 лет назад. Поэтому
Результаты тестов... 277
мы спросили современных учены х, к ак они используют тест. Мы послали
анкетные опросы 110 клиническим психологам, которые являлись лидера
ми в диагностическом тестировании. Мы написали краткие описания шес
ти типов пациентов и попросили, чтобы каж ды й психолог сообщил нам,
каки е характеристики он видел в рисунках каждого. Эти ш есть описаний
были: (1) “он обеспокоен тем, насколько он муж ественный,” (2) “он подо
зрителен к другим лю дям”, (3) “он обеспокоен тем, насколько он умен”, (4)
“он обеспокоен тем, что его корм ят и о нем заботятся другие лю ди”, (5) “у
него были проблемы с сексуальной потенцией” и (6) “он очень обеспокоен
тем, что люди говорят о нем плохо”. Мы попросили психологов определить
в каж дом случае, какой пациент, нарисовал какого человека.
Мы получили 44 заполненных анкеты , и было ясно, что психологи со
глаш ались друг с другом относительно характеристик рисунка, которые они
видели в каж дом случае. Например, большинство психологов (91% ) сказа
ло, что подозрительный пациент будет рисовать большие или необычные
глаза. 82% сказали, что человек, обеспокоенный своим интеллектуальны м
уровнем, будет иметь тенденцию рисовать большую или выделенную голо
ву (см. табл. 1).
Согласие не было абсолютным, но было внуш ительным. Вообще, психо
логи согласились по поводу двух или трех характеристик рисунка, которых
они будут ож идать от каж дого типа пациента.
П ары
Больш инство психологов имело кандидатскую степень и в среднем 8,4 лет
опыта в психодиагностике. Интересно, каки е признаки ТРЧ обнаружили
бы наблю датели, у которы х не было почти никакого опыта.
Чтобы выяснять это, мы собрали 45 рисунков мужских фигур - 35, нарисо
ванных психическими больными в близлежащей государственной больнице и
10 рисунков, выполненные аспирантами в области клинической психологии. Мы
измерили размер головы в каждом рисунке, размер глаз и т.д., и попросили не
зависимых людей оценить рисунки на предмет более субъективных характери
стик, таких как муже- или женоподобие.
К каж дом у рисунку мы прилож или два из ш ести диагнозов, которые мы
вы сы лали психологам - например, “человек, который нарисовал это: (1)
подозрителен к другим лю дям и (2) имел проблемы с сексуальной потенци
ей”. Имелось 15 отличных пар, которые могли быть получены из этих ш ес
ти утверж дений, так что мы использовали каж дую пару на трех различны х
картинах.
Мы приписывали диагнозы систематически всем типам рисунков. Н апри
мер, предложение: “он обеспокоен тем, насколько он умен” появлялась так
ж е часто на рисунках с маленькими головами, к ак и на рисунках с большими
головами.
278 КОВАРИАЦИЯ И КОНТРОЛЬ
Затем мы отобрали группу студентов колледж а и выбрали 108 человек,
которы е заявили, что они никогда не слыш али о рисуночных тестах и не
знаю т ничего относительно того, к ак они интерпретирую тся.
Мы опросили студентов в группах. Перед каж ды м опросом мы кратко
объяснили суть ТРЧ . Мы сказали, что студент увидит ряд рисунков, н аря
ду с кратким и утверж дениями относительно диагноза людей, которые на
рисовали их. Мы сказали, что у многих людей были одинаковые проблемы,
и что студенты долж ны тщ ательно исследовать картинки и поискать общие
характеристики в рисунках людей с одинаковой проблемой. Студенты про
смотрели рисунки в заранее спланированном случайном порядке, останав
ливаясь на каж дом в течение 30 секунд.
Подтверждение
Х отя мы тщ ательно сбалансировали картинки и диагнозы так, чтобы не было
н икаки х объективны х связей между ними, почти каж ды й испытуемый со
общ ил, что он видел эти связи. И связи, которые студенты обнаружили, были
подобны тем, которы е видели психологи в своей еж едневной практике.
Имелись некоторые различия, конечно, но студенты имели тенденцию опи
сы вать обычный рисунок каж дого типа пациента в тех ж е самых терминах,
которы е использовали психологи. И в случае студентов, мы знаем, что при
знаки были иллю зорны, потому что о них не сообщалось в данных.
Наш е предыдущее исследование относительно пар слов предлагает объяс
нение: вспомните, что мы обнаружили, что слова с сильными ассоциатив
ными связям и имеют тенденцию быть замеченными появляю щ имися вме
сте. Возможно, тот ж е самый механизм был и у признаков ТРЧ. Мы прове
ли анкетны й опрос по ассоциации слов, чтобы определить, к ак близко обла
сти симптома (подозрительность, интеллект, импотенция, и т.д.) связаны с
различны ми частями тела (глаза, голова, половые органы, мускулы, и т.д.).
Вопросы им ели следующую форму: “Тенденция слова ПОДОЗРИТЕЛЬ
НОСТЬ ассоциироваться со словом ГОЛОВА (1) очень сильная, (2) сильная,
(3) умеренная, (4) м аленькая, (5) очень м аленькая, (6) никакой тенденции
нет вообще”.
Мы провели анкетны й опрос 45 студентов, которые не участвовали в дру
гих частях эксперимента. Вербальные ассоциации, о которых они сообщи
ли, четко совпадали с ложными корреляциям и, которые “наивны е” студен
ты видели между характеристиками рисунка и симптомами. Устные ассо
циации даж е более близко совпадали с корреляциям и, о которых сообщали
практикую щ ие психологи.
О плата
В наш ем следующем эксперименте мы опросили 56 человек в течение трех
дней подряд, чтобы увидеть, осознают ли они, что нет никакой истинной
характеристики обеспокоен- подозрительно обеспокоен- обеспокоенные имели обеспокоен-
рисунков ные, на- относятся к ные, на- тем, что их проблемы ные тем,
сколько они другим людям сколько они кормят и о них с потен- что люди
мужественны умны заботятся другие цией говорят о
1
1
a
a
Ä
3 з-
W СО
§ 3 о
о
о
о
Я
яо
я
Я
И
Ч
а>
о
тН
о
Cg
О
00
00
О
25 31
со
76
СО
М
£& *к
в &
о
о
о
Cg
тН
СЧ1
я
3
ч
гЧ g cg
О
со
43 26
О)
58
I
СО
§
3л
о
ю
Я
Ен
m
от
cg
о
о
тН
С
ь-
О
О)
ю
82 55
СО
со tsi
х
х
гН
cg
о
о
гН
X
fc -
Я
о
3
О
Я
68
Qi
&
о
х
о
о
о
X
тН
ё
55
»Е4*
1 8.S
Я SS И
о
о
cg
о
о
о мо
& я
X
Рч 3
3 юо
64
X Я Я со
55
СО
о
я
3
о
ю
и
cg
cg
cg
14 18 52
О
17 18 44 21 21
Результаты тестов.
О м
Я2
о
о
о R я
Я
Я
00
гН
О
тН
лЕ*
О
Ен
cg
тН
тН
тН
23 25 13
cg
23 22 32 39
детскость
279
280 КОВАРИАЦИЯ И КОНТРОЛЬ
со СО 00 о о о 1—1
о СМ о о о о о
27
со СО см о см м*
гН
18
23
тН ь- см о о
CÖ
со см о о СО
о о g ^ ° О t-
00
со см о
см «S ° о
СМ СО 00 о о о
см см см
со 00 см
со о ю OS
см см
s й
о Я
ft ф
IgggS
в. S Я 81 ö и ^
g ®
CM СО f t О тИ О ю
-J о о И и « гН
Результаты тестов... 281
корреляции между признаками и рисунками, если предоставить им возмож
ность увидеть материалы тестирования больше, чем один раз. Корреляции
наблюдались так ж е отчетливо в третий день, к ак и в первый. Мы начали
понимать, насколько сильной может быть лож ная корреляция, и поинтере
совались, каки е условия, если таковые вообще имею тся, позволят преодо
леть ее.
Мы опросили еще 41 человека индивидуально и позволили каждому смот
реть на рисунок, так долго, сколько он хотел. Чтобы поощрить их изучать ри
сунки тщательнее, мы предложили $ 20 студенту, чьи оценки будут наиболее
точными.
Это не сработало. Студенты видели лож ные корреляции так ж е настоя
тельно, к ак всегда.
Н аконец мы остановились и дали испытуемым все возможности, кото
рые могли только придумать, чтобы они могли проверить свое собственное
восприятие. Мы предложили каж дому испытуемому все множество рисун
ков, чтобы он сам их изучил; мы сказали ему, что он может смотреть на них
в любом порядке столько времени, сколько он хотел. Он мог расклады вать
рисунки в стопки и делать прямы е сравнения. Он мог помесить все рисун
ки , сделанные подозрительными людьми, в одну стопку и искать подобие в
них. Мы дали каж дому испытуемому бумагу для заметок, карандаш и ли
нейку; мы снова предложили $ 20 человеку, чьи оценки будут наиболее точ
ны , и мы дали каж дому испытуемому копию заклю чительного анкетного
опроса, так что он мог видеть то, на каки е вопросы ему придется отвечать.
М у ж ествен н о сть
В этих условиях лож ная корреляция понизилась значительно для большин
ства признаков, но она не исчезла. Н апример, в нормальных условиях 76%
студентов видели связи между людьми, волную щ имся о своей мужествен
ности и тенденцией рисовать мускулисты е фигуры; в новых условиях, 45%
все ещ е заявляли, что они видели связи, которых там не было. Л ож ная кор
реляция сильна и примечательно стойка к любым попы ткам изменить ее.
Студенты даж е утверждают, что видели типичные корреляции, когда ри
сунки были сложены в противоположном направлении. В одном исследова
нии, например, мы поместили утверждение, “Его волнует его уровень интел
лекта” только на рисунках с маленькими головами; утверждение относитель
но подозрительности появлялось исключительно на рисунках с маленькими
глазами, и т. д. Это несколько уменьшило иллюзорную корреляцию , но не ус
транило это. Ш естнадцать процентов все равно заявили, что пациенты, кото
рых волновал их уровень интеллекта, рисовали фигуры с большой головой, а
50% все еще видели отношения между людьми, волнующимися относитель
но мужественности, и тенденцией рисовать мускулистые фигуры - даже при
том, что истинные связи были противоположными.
282 КОВАРИАЦИЯ И КОНТРОЛЬ
И з наш его исследования очевидно, что клинические интерпретации ТРЧ
содержат сильны й компонент иллю зорной корреляции. И реш ения, кото
ры е принимаю т психологи относительно их пациентов, могут быть проек
цией собственных предвзяты х мнений.
П ятн а
Интересно, присутствовали ли иллю зорные корреляции в наиболее попу
лярном испы тании из всех - чернильные пятна Рорш аха - и если так, будут
ли они замечены так ж е ясно, к ак и истинные корреляции, те немногие при
знаки Рорш аха, которые считаю тся валидными индикаторами некоторых
характеристик личности.
В 50-летней истории теста Рорш аха, многие психологи сообщили, напри
мер, что определенные ответы даются более часто гомосексуалистами, чем
другими людьми. В 1949, Уильям Уилер (W illiam W heeler) суммировал 20
признаков гомосексуализма по Рорш аху. Другие исследователи проверили
признаки Уилера, но только 2 из 20 признаков были сочтены валидными бо
лее, чем одним исследователем. Один из них (номер семь), - реакция на чет
вертое чернильное пятно, — “человек или животное, искаженное, чудовищ
ное или угрожаю щ ее.” Другой валидный признак, - восьмой у Уилера, - со
общение о странной фигуре животного-человека на пятой карте.
П р и зн а к и
Чтобы исследовать, к ак психологи ф актически используют тест Рорш аха,
для диагностики гомосексуализма, мы послали анкету 76 психологам, по
просив и х, описать две перцепции, которы е гомосексуальные пациенты
обычно видят в 10 пятнах Рорш аха. Из психологов, которые возвратили за
полненные анкетны е опросы, 32 сказали, что они видели протоколы Рор
ш аха, касаю щ иеся гомосексуалистов. Эти 32 специалиста описали несколь
ко признаков Рорш аха, но из тех, что они упомянули, наиболее частыми
были (1) ягодицы или задний проход, (2) гениталии, (3) ж енская одежда, (4)
человеческие фигуры неопределенного пола, без ясны х м уж ских или ж енс
ки х признаков, и (5) человеческие фигуры, к ак с м уж ским и, так и с ж енс
ким и признаками. Все это - признаки Уиллера, которые не были подтверж
дены исследованием. С другой стороны, только два психолога упомянули
валидны й признак номер 7 - искаж енная, чудовищ ная фигура, и ни один
не упомянул другой валидны й признак, номер 8 — “полу-человеческая-
полу-ж ивотная” фигура.
Н екоторые психологи видели признаки в тесте Рорш аха, которы х не
было, и не могли увидеть признаки, которые там были. И вновь наш е иссле
дование с вербальными ассоциациями предлагает клю ч к разгадке. Два ва
лидны х признака не интуитивны: гомосексуализм не ассоциируется ни с
ры чащ ими ж ивотны ми, ни с человеко-животными гибридами. Но гомосек
Результаты тестов... 283
суализм имеет высокую вербальную ассоциацию с пятью признакам и, о ко
торых клиницисты сообщали наиболее часто. Так или иначе, разумно ож и
дать, что гомосексуалисты будут склонны видеть ягодицы , женскую одеж
ду или фигуры неопределенного пола в чернильных пятнах.
И деи
Мы проверили эти понятия объективно, попросив 34 независимых студен
тов оценить, к ак сильно слово “гомосексуализм” ассоциирует с различны
ми идеями. И х оценки совпадали - популярные, но невалидные признаки
имеют более сильную вербальную ассоциацию с гомосексуализмом чем, два
непопулярны х, но валидны х признака. Это предполагает, что признаки го
мосексуализма, которые как утверждают пихологи, они видели в тестах Рор
ш аха, могли просто отразить их собственные предположения и ож идания.
Мы проверили это утверждение с помощью проекта, подобного тому, ко
торый мы проводили в рисуночном тесте. Мы получили несколько карт Рор
ш аха, и к каж дой мы прилож или ответ - некоторый образ, который чело
век, предположительно, заметил на карте. Область карты , которая относи
лась к ответу, была обведена кругом.
Н а некоторых чернильны х пятнах ответ был валидным признаком гомо
сексуализма (например, “гигант с морщ инистыми рукам и”), на других, от
вет был невалидным признаком (например, “ш нурованный ж енский кор
сет”), а на третьих, это был нейтральны й признак (например, “карта Испа
нии”). Н иже ответа были два описания человека, который проходил тест. Мы
выбрали эти описания из всех возможных пар из группы, состоящей из четы
рех описаний: (1) “он проявляет сексуальное влечение к другим мужчинам”,
(2) “он полагает, что другие люди сговорились против него”, (3) “он испыты
вает грусть и депрессию в течение длительного времени” и (4) “у него силь
ное чувство собственной неполноценности. ” Мы, конечно, были больше всего
заинтересованы первым утверждением.
С м еш и в ан и е
К ак в исследованиях ТРЧ, мы систематически приписывали утверж дения
признака к картам так, чтобы не было н икаких последовательных связей
между любым из утверждений и любым признаком.
После того, к ак студенты просмотрели несколько карт, мы спросили их,
каки е образы увидели пациенты с каж ды м из четы рех типов признаков.
Студенты сообщили, что гомосексуалисты более часто видели ягодицы , ге
ниталии, и т.д ., - то есть, те ж е самые п ять невалидны х признаков, о кото
ры х сообщили психологи. Ни один из студентов не увидел связи между го
мосексуализмом и двумя валидны ми признакам и.
В более поздней вариации теста мы преднамеренно ввели отрицательную
корреляцию в материалы теста, так, чтобы утверждение “Он испытывает
284 КОВАРИАЦИЯ И КОНТРОЛЬ
сексуальное влечение к другим муж чинам” никогда не появилось на карте,
которая была воспринята к ак ж енская одежда, ягодицы, и т.д. Это не умень
ш ило ложную корреляцию - студенты видели ее так ж е четко, к ак прежде.
С в я зь
Эти исследования показываю т насколько легко полагать, что два независи
мы х события связаны , особенно, когда существует некоторая субъективная
вербальная ассоциация между ними. Н аш и испытуемые видели сильные
лож ны е корреляции между симптомами и признакам и проективны х тес
тов в краткой, структурированной задаче. Задача психолога, безусловно,
намного сложнее. Проблемы реального пациента многочисленны и неопре
деленны , - редко когда пациент имеет только два четко определенных при
зн ака. И реальны е пациенты проявляю т много различны х реакций в про
ективны х тестах, а не только одну. Такж е вероятно, что в реальной практи
ке иллю зорные корреляции, которые психолог наблюдает, усиливаю тся со
общ ениями его коллег-психологов, которые непосредственно подвержены
тем ж е самым иллю зиям. Согласие усиливает иллю зии. Н аш им студентам,
с другой стороны, не позволяли говорить друг с другом в течение теста, так
что каж ды й увидел свои собственные ложные корреляции. Вот почему ве
роятно, что практикую щ ие психологи имеют дело с лож ными корреляция
м и, которые являю тся даже более сильны ми, чем те, о которых сообщили
наш и испытуемые.
Т р у д н о сти
Мы не хотим сказать, что клинические психологи некомпетентны или сле
пы к ф актам , к ак некоторые могли бы заклю чить. Н аш и данные указы ва
ют не на некомпетентность психолога, а на чрезвычайную трудность его за
дачи. Психологи подвержены тем ж е иллю зиям , что и другие люди. По ана
логии, почти все говорят, что две горизонтальны х линии имеют различны е
длины , когда они рассматриваю т рисунок М ю ллера-Лайера (M iiller-Lyer):
Дэвид М. Эдди
П р о б л ем а
Биопсия груди - не тривиальная процедура. Наиболее обычный вариант
(около 80% ) - ампутационная биопсия, при которой подозрительная опу
холь удалятся хирургическим путем для микроскопической экспертизы и
гистологического диагноза патологом. Обычно пациент кладется в больни
цу и проходит полный набор дооперационных диагностических процедур.
Биопсия почти всегда делается под общей анестезией (с вероятностью смер
ти от анестезии приблизительно в 2 из 10. 000 случаев). Делается малень
*Подготовка этой книги была поддержана грантом от семейного фонда Генри Дж. Кэйсера.
Вероятностные рассуждения... 287
кий (от 1 до 2 дюймов) разрез и удаляется ткань размером от ореха до сливы.
Во многих случаях (возможно 1 из 2) потеря ткани практически незаметна;
в других - сохраняется небольшое углубление. В редких случаях (возмож
но 1 из 200) организм подвергается воздействию инф екции, которая может
сохраняться в течение нескольких недель. Это стоит приблизительно $700.
Эта процедура может быть сделана в амбулаторных условиях и под местной
анестезией. К ак альтернативу к ампутационной биопсии, некоторые хирур
ги предпочитаю т получать образец ткани, используя иглу. Это мож ет быть
сделано в амбулаторных условиях, без шрамов или других остаточных эф
фектов, и гораздо дешевле. Однако по мнению многих врачей, этот опыт яв
ляется менее надеж ны м, потому что злокачественное образование может
быть пропущ ено.
Важный ф актор, который определяет необходимость биопсии - возмож
ность того, что опухоль в груди - раковая. Чтобы оценить эту возможность,
врач может перечислить возможные болезни, оценить частоты, с которыми
различны е признаки и симптомы сопутствуют каж дой болезни, сравнить
эту информацию с результатами пациентки, оценить вероятность, что у нее
есть одна из болезней в списке и провести биопсию, если вероятность рака
или другого заболевания достаточно высока. Чтобы помочь врачу, многие
учебники описывают, чем доброкачественные болезни отличаю тся от рака.
Н апример, следующ ий абзац описы вает одну такую доброкачественную
болезнь - мастопатию.
Мастопатия часто путается с карциномой груди. Она обычно бывает у рожавших жен
щин с маленькой грудью. Наиболее часто она встречается в верхнем внешнем квадран
те, но может находиться в других частях, и, в конечном счете, охватывать всю грудь.
Она часто болезненна, особенно в предменструальный период, и обычно сопровождает
ся менструальными расстройствами. Выделения из сосков, обычно серозные, наблюда
ются в приблизительно 15% случаев, но отсутствуют какие-либо изменения непосред
ственно в соске.Новообразование не имеет четко ограниченной формы и не прилегает к
коже. Многочисленные кисты плотные, круглой формы и колеблющиеся, а также мо
гут просвечиваться, если содержат прозрачную жидкость. Большая киста при масто
патии на ощупь подобна опухоли, но обычно она более гладкая и хорошо ограниченная.
Подмышечные лимфоузлы обычно не увеличиваются. При мастопатии редко наблюда
ются большие синеватые кисты. Чаще наблюдаются многочисленные и маленькие ки
сты.1(Del Regato, 1970, с. 860-861)
И спользование маммографии
Существуют и другие диагностические процедуры, помогающие врачу оце
нить вероятность того, что грудное образование отдельно взятой женщ ины
является злокачественным. Возможно, наиболее важ ная и обычно исполь
зуем ая из них - маммография. Суть этого испы тания состоит в том, что ком
поненты раковы х клеток поглощают рентгеновские лучи иначе, чем ком
поненты доброкачественных клеток. И зучая мамограммы, рентгенолог мо
ж ет увидеть некоторые признаки, которые наблюдаются с различны ми ч а
стотами в различны х образованиях, и , исходя из этой информации, делает
ся оценка относительно характера рассматриваемой болезни. К ак правило,
результат маммограммы классиф ицируется к ак положительный или отри
цательны й в отнош ении рака. И ногда используется расш иренная схема
классиф икации, такая, например, к ак схема, содерж ащ ая три класса: зло
качественны й, подозрительный и доброкачественный.
Эта диагностическая процедура не соверш енна, так к ак в ней некоторые
злокачественные повреждения неправильно классифицирую тся к ак добро
качественны е, и некоторые доброкачественные опухоли классифицирую т
ся как злокачественные. Таким образом, один из факторов, который яв л я
ется очень важ ны м для врача - точность диагностики.
Вероятностное рассуждение
Давайте рассмотрим это понятие более подробно. Цель диагностической про
цедуры состоит в том, чтобы обеспечить врача информацией о состоянии
пациента. Врач использует ее для пересмотра состояния пациента и опреде
ления, к ак действовать, исходя из новой оценки. Это мож ет быть решение
пройти дальнейш ие диагностические процедуры, или если врач достаточно
уверен в состоянии пациента, мож ет быть принято реш ение о терапии. Су
щественно то, что врач может иметь различны е степени уверенности о со
стоянии пациента. Врач будет собирать данные, чтобы усилить уверенность
в том, что у пациента есть или отсутствует рак, и когда эта уверенность ста
нет достаточно сильной (в контексте серьезности болезни и изменений в про
гнозе и лечении), будут предприняты действия.
Мы мож ем связы вать вероятность, то есть субъективную вероятность
врача, что у пациента рак, с этой степенью уверенности. Результаты раз
личны х диагностических процедур, таких, к а к , например, маммография,
могут сущ ественно изменить уверенность врача или субъективную вероят
ность того, что у пациента рак.
Вероятностные рассуждения... 289
П онятие субъективной вероятности или степени уверенности появляет
ся в различны х формах в профессиональном медицинском жаргоне. Н апри
мер, один автор пиш ет, что “так к ак старш ая возрастная группа имеет са
мую большую пропорцию злокачественных новообразований, в ней повы
ш енный коэффициент подозрения на рак, по мнению врача, который стал
кивается с таким пациентом “ (Gold, 1969, с. 162). Другой автор заявляет,
что маммограмма мож ет уменьш ить количество биопсий груди “во многих
случаях, когда сложившееся мнение осматривающего врача относительно
доброкачественной опухоли поддерживается точным маммографическим
диагнозом о доброкачественности” (W olfe, 1964, стр. 253). Третий описыва
ет это так: “Если субъективное впечатление врача дает достаточно причин
для подозрения карциномы , он будет вынужден прибегнуть к биопсии, не
смотря на отрицательный результат маммограммы” (Clark и др., 1965, с.
133). Другие вы сказы вания, которые отражаю т это понятие: “уровень уве
ренности” (В у т е , 1974, с. 37), “впечатление злокачественности” (W olfe,
1967, с. 138), “более положительный диагноз” (Egan, 1972, с. 392), и т.д.
Эти утверж дения не точны, потому что мало врачей формально ознакомле
ны с понятиями субъективной вероятности и анализа при принятии реше
ний. Тем не менее, существует вполне достаточное свидетельство того, что
понятие степеней уверенности является естественным для врачей и исполь
зуется ими для определения, к ак поступать дальш е.
Где
Р (рак|пол) - вероятность того, что у пациентки рак, при условии,
что у нее положительный результат рентгеновского обследования (апо
стериорная вероятность)
Р (пол|рак) - вероятность того, что если у пациентки рак, рентгено
лог правильно диагностирует его (истинно полож ительная оценка или
чувствительность)
Р (рак) - вероятность того, что у пациентки рак (априорная вероят
ность)
Р (доброкач) - априорная вероятность того, что опухоль у пациент
ки доброкачественная (Р (доброкач) = 1 - Р (рак))
Р (пол|доброкач) - вероятность того, что, если у пациентки доброка
чественная опухоль, рентгенолог неправильно диагностирует ее как
рак (ложно полож ительная оценка)
Вероятностные рассуждения... 291
В табл. 1 приводится итог чисел, представленных Снайдером (Snyder).
Ц ифры в ячейках - соответствующие вероятности (например, Р (пол|рак) -
0.792).
И спользуя оценку врача априорной вероятности того, что опухоль яв л я
ется злокачественной и , принимая во внимание новую информацию, полу
ченную в результате процедуры, мы имеем
TW , ч (0.792 X0.01) п пп п
Р (рак пол) = ---------- --------------------------- = 0.077
(0.792 )(0.01) + (0.096 )(0.99)
Т акж е,
Р(от р Iр а к )Р (р а к )
Р (рак\отр) =
P(pm p I р а к )Р (р а к ) + Р{рт р I нерак )Р(нерак )
(0.15)(0.005)
= ---------- ------ -------- ----------- =0.00089
(0.15X0.005) + (0.85)(0.995)
2Р(А,В) ~ совместная вероятность того, что произойдет как событие А, так и событие В.
Вероятностные рассуждения... 295
приблизительно 1. 269 из них будет сообщено ложное чувство безопаснос
ти. Ф актически, только приблизительно у 9 это будет так. Значение было
завыш ено приблизительно в 150 раз.
3Это - неверное предположение, так как “точность” изменяется по мере того, как изменяет
ся исследуемая совокупность. Например, истинно-положительная пропорция более низкая
при использовании обследования в совокупности женщин, у которых не наблюдалось при
знаков болезни, потому что раковые новообразования имеют тенденцию быть намного мень
шими, и их тяжелее обнаружить. Это предположение сделано только для того, чтобы про
демонстрировать важность Р (рак).
Вероятностные рассуждения... 297
Р(доброкач), Р(здорова) и Р(пол|здорова) не рассматриваю тся в литературе.
Это приводит нас к подозрению, что их важность в анализе этих проблем не
понята. В этом примере, мы будем использовать данные, представленные
Вульфом (W olfe, 1965) и предполагать, что Р (здорова) - приблизительно
60% , и Р(доброкач) - приблизительно 40% . Мы такж е сделаем предполо
ж ение в пользу маммографии и позволим Р (пол|здорова) быть 0% .
П родолжая использовать этот пример, предположим, рентгенолог сооб
щ ает, что маммограмма у данной ж енщ ины без симптомов заболевания,
полож ительна. У читывая положительный результат маммографии, веро
ятность того, что у пациента рак (Р (рак|пол) - приблизительно 1 из 49, или
приблизительно 2.0% (табл.З). В предыдущем примере, в котором были
ж енщ ины с симптомами болезни, Р (рак|пол) была 40% . Таким образом, в
зависимости от того, кто исследуется, может существовать приблизительно
двадцатикратная разница в вероятности того, что у ж енщ ины с положи
тельной маммограммой рак.
4Любой, кто хочет убедиться в существовании порога биопсии может рассуждать, следую
щим образом. Вы согласны, что никто не захочет проходить биопсию, если вероятность рака -
1 из 30 триллионов? И мы можем согласиться, что фактически каждый хочет подтвердить
диагноз и пройти лечение, если эта вероятность - 98 из 100? Если это так, то где-то между 1
из 30 триллионов и 98 из 100 у человека находится порог биопсии. Конечно, если женщина
отказывается от биопсии и лечения даже, если вероятность рака велика, тогда у нее нет
такого порога.
5Порог биопсии - очень интересное и важное число. Его изменение оказывает большое вли
яние на количество женщин, подвергающихся биопсии, частоту непродуктивных биопсий,
стоимость лечения пациента, а также прогноз о пациенте. Из-за рискованности, а также
302 КОВАРИАЦИЯ И КОНТРОЛЬ
лить влияние маммограммы на руководство 1,000 таких пациентов. Без об
следования, все пациентки должны были бы пройти биопсию, причем 860
из них — непродуктивную. П риблизительная судьба изначальны х 1.000 па
циенток с новообразованием, при использовании мамограммы, представле
на на Рисунке I .6
потому, что, они принимают решение за другого человека, врачи, устанавливает порог био
псии весьма низко. Утверждение “если есть хоть какая-то вероятность, что опухоль злока
чественна, биопсия должна быть сделана” является типичным. “Если врач полностью не
уверен, что новообразование доброкачественно, оно должно быть подвергнуто биопсии без
промедления” (Allen, 1965, с. 640). Согласно полученным сведениям, сами женщины вооб
ще устанавливают порог выше, чем врачи, хотя бывает и наоборот.
Например, мы можем исследовать данные, взятые из большого клинического испытания, в
котором использовались маммография и физическое обследование молочной железы, что
бы выявить рак у женщин, у которых не наблюдалось никаких симптомов. (Shapiro, Strax
и Venet, 1971). В зависимости от того, как было обнаружено новообразование в молочной
железе (т. е. с помощью какой процедуры или комбинации процедур), вероятность того, что
болезнь молочной железы у женщины — рак, варьировалась от 15 до 54%. На основе поло
жительного физического обследования, врачи порекомендовали 545 женщинам с отрица
тельными результатами маммограммы пройти биопсию. Несмотря нато, что частота рака в
этой группе составляла 15% ,31% женщин отказался проходить биопсию. Частота рака у
женщин, результаты физического обследования которых были отрицательными, а мам-
мограммы - положительными равна 20%, но 29% таких женщин отказались проходить биопсию.
У женщин с положительными результатами, как физического обследования, так и мам
мограммы вероятность рака 54%, но 5% женщин предпочли не проходить биопсию в реко
мендованное время. Таким образом, из этой предварительной информации следует, что у
более чем 31% женщин порог биопсии выше 15%, у 29% женщин порог биопсии выше 20%,
а у 5% женщин порог биопсии превышает 54%.
Отрицательные Рак
новообразования 0,04
760
0,76 Нет рака 780
ТЩГ
ция, а не формальный анализ. Формальный анализ этих вопросов требовал бы лучших дан
ных. Значения для точности, используемой в тексте для оценки пациентов в группе 2 сле
дующие: Р(пол|рак)= 0.52, Р(неопр|рак) =0.24, Р(отр|рак) = 0.24, Р(пол| доброкач) = 0.075,
Р (неопр|доброкач) = 0.075, и Р (отр|доброкач) = 0.85.
304 КОВАРИАЦИЯ И КОНТРОЛЬ
Важность порога биопсии в этом примере должна быть подчеркнута. Если
врач и его пациент установили порог в 1% - то есть, если бы пациент чувство
вал, что вероятность 1 из 100 наличия рака достаточна, чтобы применить био
псию - тогда отрицательный результат мамограммы не устранил бы потреб
ность в биопсии (вероятность рака 4% превысит этот порог). М амограмма,
возможно, дала бы клиницисту некоторую информацию, но эта информация
не повлияла бы на решение о биопсии. Использование мамографии в этом
случае должно было бы быть оправдано на других основаниях.
Пересмотр практики. Этот тип анализа помогает прояснить потенциаль
ную полезность маммографии при постановке дифференциального диагно
за различны х опухолей. Это такж е помогает нам оценить следующие утвер
ж дения:
1. “М аммография оказывает мало влияния на решение относительно кли
нически (т.е. физически) ощутимой опухоли молочной ж елезы , которая, на
основе своих собственных характеристик, требует биопсии “ (из Archives of
Surgery, 1974, том. 108, стр. 589). В обследовании пациентов с новообразо
ваниям и, биопсия требовалась только на одних лиш ь клинических основа
н иях. И спользование маммографии разбивает группу на подгруппы с час
тотами рака в пределах от 53% до 4% . Биопсии можно было бы избеж ать в
последней группе, и количество биопсий могло бы быть уменьшено на 73%
(от 1. 000 из 1. 000 до 270 из 1.000).
2. “Д ля клинических целей маммография долж на обеспечить приблизи
тельно 100 процентный уровень точности прежде, чем она одна мож ет опре
делять лечение” (ш Archives of Surgery, 1 9 7 4 ,том 1 0 8 ,с. 589). В совокупно
сти, подобной второй группе, которая обсуждалась выш е, могло бы быть
весьма рационально позволить маммографии определять пациентов для
биопсии. Вспомним, что истинно-положительная пропорция, используемая
в том примере, бы ла 52% , и что более точное испытание будет даже более
ценно.
3. “М аммография - не замена биопсии” (из Oncology, 1969, том 23, с. 148).
Ц ель и маммографии, и биопсии состоит в том, чтобы обеспечить информа
цию относительно состояния пациента. Некоторые пациенты , при отсут
ствии маммографии, требуют биопсии. У некоторых из этих пациентов от
рицательный результат маммограммы устранил бы необходимость биопсию,
и в этих случаях, маммограмма заменяет биопсию.
4. “Каждому решению о прохождении биопсии долж на предш ествовать
маммограмма” (из Oncology, 1969, том 23, с. 146). Рассмотрим клинически
очевидную карциному. Вероятность рака будет превы ш ать порог биопсии
каж дого, почти независимо от того, каков результат маммограммы. Пер
вичное оправдание этой политики, в таком случае, должно леж ать в вероят
ности того, что клинически очевидная опухоль является доброкачествен
ной (иначе пациентка бы ла бы должна пройти мастектомию (удаление мо
лочной ж елезы ), и что имеется скрытое неощутимое злокачественное ново
Вероятностные рассуждения... 305
образование. Вероятность этого сложного события равна суме вероятностей
двух событий, которые являю тся чрезвычайно маленькими (приблизитель
но 1 из 5.000).
5. “Отсрочить, биопсию клинически доброкачественного новообразова
н ия груди, которое было определено доброкачественным на маммографии,
значит, сделать ш аг назад в уничтожении карциномы груди” (из Surgery,
Cynecology and Obstetrics, 1972, том 134, с. 98). Пусть “клиническая добро
качественность” будет представлена Р (рак) - 5% . После отрицательного
результата маммограммы, вероятность, что такой пациент имеет рак - при
близительно 1 % . И з 100 биопсий, 99 были бы непродуктивны. Я вляется ли
отказ от биопсии здесь ш агом назад или вперед? Другой момент - то, что,
если бы этой стратегии следовали, все новообразования, начиная от “кл и
нически доброкачественных” и заканчивая клинически очевидными кар
циномами, требовали бы биопсии, независимо от того, каков был исход об
следования. Это, каж ется, противоречит утверждению автора, что “когда
используется в своем надлеж ащ ем виде, маммография является превосход
ным дополнением для врача в лечении карцином ы груди” (из Surgery,
Cynecology and Obstetrics, 1972, том 134, с. 98).
6. “М аммография никогда не долж на использоваться вместо биопсии,
когда мы имеем дело с ‘доминирующим новообразованием’ в груди, и ни
когда не долж на изменить основной хирургический подход в болезнях гру
ди, то есть, ‘опухоль - это опухоль’ и oi а долж на быть подвергнута биопсии
либо путем разреза, либо путем аспирации” {аз Archives of Surgery, 1966,
том 93, стр. 854). П ациентки с доминирую щими новообразованиями и по
рогами биопсии выш е чем 5% не согласились бы с этим утверждением.
7. “В сомнительных случаях полагаться на маммограмму ошибочно. Она
необходима после обследования и прощ упы вания молочной ж елезы , чтобы
реш ить, будете Вы или нет делать биопсию, если рентген не доступен. Если
Вы реш или проводить биопсию - проводите ее. Если Вы уверены, что нет
н икаких симптомов для хирургического вмеш ательства или физического
обследования, направьте пациентку н а маммограмму. К ак только врач го
ворит к себе, и особенно, если он говорит пациентке, “Я не совсем уверен,
давайте пройдем рентген”, он подсознательно полагается на отрицательный
результат маммограммы, когда нужно рассчитывать только на положитель
ны й. Это - психологическая ловуш ка, в которую все мы склонны попадать,
и которая намного серьезней, чем некоторое количество ложно-положитель
ны х диагнозов, достигнутых при помощи маммографии” (R hoads, 1969, с.
1182). Ни одной биопсии не удастся избежать, применяя эту стратегию. Это -
позор, ведь сам автор выш еупомянутого утверж дения говорит, что, “суще
ствует мало областей, в которых требуется так много хирургии, которой
можно было бы избеж ать лучш ими методами диагноза, чем в области болез
ней молочной ж елезы ”.
306 КОВАРИАЦИЯ И КОНТРОЛЬ
Мы теперь готовы оценить следующую историю, которая появилась в
“Хрониках” в Сан-Ф ранциско (K ushner, 1976). У женщ ины-репортера не
давно обнаружили опухоль в молочной ж елезе, и она описывает консульта
цию с врачом.
“ Я хотел бы, чтобы Вы прошли ксеромаммограмму. Это новый способ делать
маммограммы - снимки молочной ж елезы .”
“А она дает точные результаты?”
Он пожал плечами, “Вероятно, столь ж е точные, как любой снимок. Вы
знаете, - предупредил он, - “даж е, если результат отрицателен - что означает,
не злокачественное новообразование - единственный способ убедиться в этом
состоит в том, чтобы вырезать опухоль и рассмотреть ее под микроскопом”.
Ж енщ ина обсудила эту проблему со своим мужем.
“Что сказал доктор?”
“Он хочет сделать ксеромаммограмму. Тогда, независимо от результата,
опухоль нужно будет вырезать”.
“Так, зачем сначала нужно делать рентген?”
“Я думаю, потому, что так надо. И наш доктор говорит, что обследование
дает правильные результаты приблизительно в 85% случаев.... Так, сначала
я записалась на термограмму - она будет либо положительная, либо отрица
тельная, и если этот результат совпадает со снимками ксеромаммограммы,
то статистика говорит, что диагноз был бы на 95% надежный”.
Обсуждение
Эти примеры были представлены, чтобы проиллюстрировать сложность при
няти я реш ения в медицине и продемонстрировать, к ак некоторые врачи уп
равляю т одним иэ аспектов этой сложности - вероятностями. Случай, кото
рый мы исследовали - относительно простой, использование единственно
го диагностического обследования для распределения опухолей на две груп
пы злокачественные и доброкачественные. Б аза данных для этой проблемы
относительно хорош а. Точность и диагностическая ценность процедуры
были исследованы и проанализированы во многих учреж дениях в течение
многих лет. К ак вы разился один исследователь, “я не знаю ни о какой дру
гой медицинской процедуре, которая была бы больше проверена и перепро
верена, чем маммография” (Egan, 1971, с. 1555).
Вероятностные методы, обсужденные в этой главе, были известны в те
чение столетий. В последних двух десятилетиях они применялись все боль
ш е и больш е для медицинских проблем (например, L usted, 1968), и исполь
зование систематических методов для управления неопределенностью воз
растало в учебных планах медицинских факультетов, статьях ж урналов и
образовательных программах для аспирантов. В настоящ ее время, однако,
применение этих методов было спорадическим и еще не отфильтровалось,
чтобы затронуть мыш ление больш инства практикую щ их врачей. К ак про
иллю стрировано в этом социологическом исследовании, медицинские про
блемы слож ны , и сила формального вероятностного рассуж дения обеспе
чивает большие возможности для улучш ения качества и эффективности
медицинского обслуживания.
19. Получение знаний из опыта и условно -
оптимальных правил при принятии решения*
П о л у ч ен и е зн а н и й и з о п ы та: К ак ?
Очевидно, что принятие реш ения ориентировано на действие; каж ды й дол
ж ен вы брать, какое действие соверш ить, чтобы удовлетворить основные
310 КОВАРИАЦИЯ И КОНТРОЛЬ
потребности и нуж ды . Поэтому, для любого организма важ но изучить сте
пень, в которой действия будут вести к ж елательны м или нежелательным
результатам. Это означает, что получение знаний из опыта, главны м обра
зом, должно вклю чать в себя изучение связей действие-исход. Кроме того,
так к ак действия и исходы следуют друг за другом, люди склонны видеть
связи меж ду ним и к а к вы раж ение причинно-следственны х отнош ений
(M ichotte, 1963). Поэтому, сильная тенденция видеть причинные отнош е
н ия может рассматриваться к ак следствие потребности принимать меры для
удовлетворения основных потребностей. Кроме того, к ак показали Канеман
и Тверски (K ahnem an и Tversky, 1979b), изучение причинных отношений и
организация событий в причинные “схемы” позволяет людям достигать свя
занной интерпретации их опыта. Наконец, изучение связей действие-исход
важ но для понимания того, к ак люди изучают собственные вкусы или по
требности. Например, рассмотрим ребенка, который выбирает некий овощ,
ест его, испытывает неприятный вкус, и , таким образом, учится связывать
отрицательную полезность с этим продуктом. Обратите внимание, что имен
но путем выбора испытываются последствия и усваивается полезность. По
этому, усвоение связей действие-исход и усвоение полезности тесно связано.
Х отя мы получаем знания из опы та, предпринимая действие, к ак чело
век первоначально учится выбору альтернатив? Несомненно, больш ая часть
первоначального изучения происходит методом проб и ошибок; то есть люди
беспорядочно делают выбор и наблюдают исходы (ср. Campbell, 1960). Про
цесс, с помощью которого обучение путем проб и ошибок ведет к развитиюм
стратегий или правил, не известен (cp. Siegler, 1979). Однако можно пред
полож ить, что и подкрепления из эмпирического опы та, и обобщения (как
по стимулам, так и по реакциям) играю т важную роль (Staddon и Sim melhag,
1971). В любом случае, правила, которые мы разрабатываем, каж ется, не
посредственно связаны с получением знаний того, какие исходы будут вы
текать из определенных действий. К ак описано выш е, получение знаний из
опы та в основном индуктивно по характеру, то есть человек попадает в не
которые ситуации или случаи, и разрабаты вает эвристику, чтобы обеспе
чить некоторый общий способ справиться с ними. И ндуктивный характер
получения знаний из опы та имеет несколько значений относительно эврис
тики:
1. Специфика правил. Если получение знаний происходит индуктивно с
помощью определенных случаев, то эвристические правила должны силь
но зависеть от контекста. Большое количество сведений говорит о том, что
это действительно так (G rether и P lo tt, 1979, L ichtenstein и Slovic, 1971;
Sim on и H ayes, 1976; Tversky и K ahnem an 1980). Способ, которым проблема
сформулирована или показана, или ож идается определенная реакция, все
это, каж ется, имеет огромное значение для того, к ак обрабатывается инфор
м ация и порождаю тся ответы. Я ркий пример этой специфики можно обна
руж ить в работе Саймона и Хайеса (Simon & Hayes, 1976), посвященной “про
блемным изоморфам” (problem isom orphe). Они показали, что различны е
Получение знаний из опыта... 311
поверхностные формулировки идентичных по структуре проблем (то есть,
проблем, которые могут быть реш ены, используя идентичные принципы)
сильно изменяю т то, к ак люди представляю т проблему в пам яти и , следова
тельно, реш аю т ее. Важное значение этого результата заклю чается в следу
ющем: чтобы сделать эвристические модели более прогнозирую щ ими, че
ловек долж ен столкнуться с задачей, к ак она была ему предоставлена, и не
обязательно с ее структурой, к ак видит ее экспериментатор. Особенно яр
ким примером важности этого явления при прогнозировании поведения яв
ляется наблюдение, что поведение зависит от того, представлено ли сокра
щ ение налогов к ак выгода или к а к меньш ий убыток (K ahnem an и Tversky,
1979b).
2. Общность правил. Если эвристики - это правила, изученные с помо
щью индукции, необходимо сгруппировать задачи по подобию, иначе было
бы столько правил, сколько и ситуаций. Так к ак последняя возможность
недопустима, эвристика долж на иметь некоторую общность по задачам. Од
нако это заклю чение противоречит тому, что было сказано выш е относи
тельно зависимости от контекста и специфичности правил. Этот парадокс
мож ет быть реш ен, если рассмотреть диапазон задач, к которым правило
мож ет прим еняться. Н апример, рассмотрим правило “Н икогда не заказы
вайте рыбу в ресторане, специализирую щ емся на м ясе.” В то время к ак та
кое правило является общим относительно некоторого типа ресторанов, оно,
безусловно, более определенно, чем правило “О ценивайте вероятность, с
которой событие В происходит из процесса А их степенью подобия” (Tversky
и K ahnem an, 1974,1). Очевидно, последняя эвристика имеет намного более
вы сокий уровень общности. Ф актически, эвристики, такие к ак репрезента
тивность, доступность, привязка, и регулировка - “метаэвристики,” то есть
они - правила о том, к ак производить правила. Поэтому, когда человек стал
кивается с задачам и, с которыми он не встречался прежде (подобно оценке
вероятности событий), или задачам, специф ика которых заставляет их к а
заться новыми, метаэвристика определяет способ, с помощью которого оп
ределенные правила могут быть сформулированы для реш ения проблемы.
И дея о метаэвристиках позволяет сохранить общность, которую любое пра
вило обязательно подразумевает, и в то ж е время учитывает важ ны е эффек
ты контекста, формулировки, способа ответа, и так далее. Чтобы проиллю
стрировать это, рассмотрим исследование Словика, Ф ишхоффа и Л ихтен
ш тейна (Slovic, Fischhoff и L ichtenstein, 1976; см. такж е Главу 33), в кото
ром людей просили оценить относительные вероятности смерти от необыч
ны х причин. Например, что более вероятно: быть убитым молнией или уме
реть от эмфиземы*? Когда люди сталкиваю тся с таким вопросом, сущ еству
ет много способов попы таться ответить. Одно из правил, которое могло бы
использоваться, гласит: “Вспомнить знакомы х мне людей, которые умерли
от двух причин, и выбрать ту, из-за которой умерло больше людей”. В моем
*Эмфизема - заболевание легких ( п рим , р е д а к т о р а ) .
312 КОВАРИАЦИЯ И КОНТРОЛЬ
собственном случае, я выбрал бы эмфизему (что имеет более высокую веро
ятность, хотя большинство людей выбирает удар молнии). Однако, я мог бы
такж е легко разработать правило, которое приведет к противоположному
ответу; например, “Вспомнить о всех случаях смерти от удара молнии и от
эмфиземы, о которы х я когда-либо слышал (газеты , телевидение, и т.д .)”.
Если бы это было моим правилом, я выбрал бы удар молнии к ак более веро
ятны й. Обратите внимание, что в обоих случаях я использовал эвристику
доступности. Ясно, что способ, которым вопрос был сформулирован, мог сти
мулировать определенные правила, что привело бы к различны м результа
там, и все ж е эти определенные правила могли бы быть систематизированы
под отдельную , более общую стратегию или метаэвристику (такж е см .,
E inhorn, K leinm untz и K leinm untz, 1979).
3. Сила эвристики. Если эвристика усваивается индуктивно, то усвое
ние происходит в течение многих испы таний с многократным закреплени
ем. Мы увидим, благодаря способу, которым осуществляется обратная связь,
и благодаря методам, которые мы используем, для проверки правила опы
том, положительное закрепление может происходить даж е для неправиль
ны х правил (W ason, I960). Кроме того, в дополнение к большому количе
ству закрепления, которое мы испы ты ваем, размер или интенсивность зак
репления мож ет быть такж е большим. Например, получая значительную
сумму денег после использования некоторого правила в выборе акций, мы
долж ны испы ты вать значительны й эффект закрепления. Поэтому, в отли
чие от лабораторных исследований процессов обучения, где этические сооб
раж ения предотвращ аю т получение большого положительного и отрица
тельного подкрепления, наш собственный опыт не ставит никаких подоб
ны х ограничений.
П о л у ч ен и е зн а н и й и з о п ы та: Н а с к о л ь к о хорош о?
Вопрос, насколько хорошо мы получаем знания из опыта, переклю чает вни
м ание на сравнение эвристических правил с оптимальны ми правилам и.
Поэтому, возникает вопрос, к ак последние изучаю тся и каковы их значе
н ия для применения в наш ем собственном опыте? Оптимальные правила,
такие к ак теорема Байеса, оптимизация, и т.д ., изучаю тся дедуктивным
путем. Ф актически, многое из того, что мож ет назы ваться формальным
изучением, имеет дедуктивный характер, то есть нам преподают научные
законы , логические принципы , математические и статистические прави
л а, и т.д. Такие правила по своей природе очень абстрактны и не зависят от
контекста. Кроме того, когда контекст может влиять на форму правила, нам
часто говорят, что правило сохраняется, “при прочих равны х условиях”.
Конечно, в наш ем собственном опыте “прочие условия” редко равны , что
делает изучение оптимальных правил с помощью индукции столь трудным.
(П ервоначальны е исследователи или изобретатели оптимальны х правил
преодолели эти трудности; однако, это отличает их от остальной части нас.)
Получение знаний из опыта... 313
А бстрактны й характер дедуктивны х правил имеет большое значение
относительно трудностей, с которыми сталкиваю тся люди при применении
оптимальны х методов в определенных ситуациях. Эта трудность сосредо
тачивается вокруг способности различать структуру задач, встроенную в
большое количество подробностей. Поэтому, когда перед нами стоит опре
деленная проблема, богатая на детали, и в которой детали могут быть несо
ответствующими или избыточными, внимание к специфическим особенно
стям, вероятно, отвлечет внимание от общей структуры проблемы. Ф акти
чески, именно абстрактность дедуктивно изучаемы х оптимальных правил
не позволяет им восстанавливаться из пам яти (см. N isbett и др., 1976, см.
г л. 7). А бстрактные правила, поэтому, могут быть “не доступны” в опреде
ленны х случаях. Однако спорный вопрос не реш ен, так к ак важ но знать,
почему эти правила не доступны.
Рассмотрим способ, которым комбинации действие-исход, вероятно, орга
низованы и сохранены в памяти. В частности, рассмотрим, будет ли такая
информация организована и сохранена в памяти по содержанию или по струк
туре задачи. К аж ется более легким и “естественным” организовать комбина
ции действие-исход скорее по теме, чем по структуре; например, опыт со ш ко
лой, родителями, людьми противоположного пола и т.д ., чем задачи Байеса,
ситуации выбора, проблемы оптимизации и так далее. Ф акт, что содержание
может отличиться, в то время к ак структура остается той ж е, весьма трудно
увидеть (Einhorn и др., 1979; K ahnem an & Tversky, 1979b; Simon & Hayes,
1976). Поэтому, я думаю, вряд ли большинство людей организует свои опы
ты по структуре задачи. Я не говорю, что человек не может научиться дей
ствовать таким образом. Ф актически, большая часть профессионального обу
чения именно такова; например, человека обучают обращаться с проблема
ми к ак принадлежащ ими к некоему классу проблем, имеющих данную струк
туру и (иногда) известное решение. Оптимальные правила, таким образом,
могут быть “доступны” с помощью обширного обучения. Конечно, существу
ет опасность, что такие правила будут чересчур легко доступны; то есть про
блемы вынуждены складываться в несоответствующую структуру, потому
что реш ение существует в пределах этой структуры. Банально, что при стол
кновении с проблемой, профессионалы рассматривают ее в пределах струк
тур, видеть которые они были обучены. Поэтому, хотя обучение профессио
нала действительно включает структуры, такое обучение находится в преде
лах узко определенной содержательной области.
Дальнейшие сведения, иллюстрирующие потребность в группировании про
блем скорее по содержанию, чем по структуре, приводятся при рассмотрении
способа, с помощью которого организовано и изучается знание людей о мире.
Например, специализированное образование, профессиональное обучение,
каталогизация информации в библиотеках и энциклопедиях, и так далее, ил
люстрирует организацию информации скорее по содержанию, чем по структу
ре. В то время как существуют большие преимущества в организации знания
таким образом, имеются также и недостатки. Трудность применения оптималь
314 КОВАРИАЦИЯ И КОНТРОЛЬ
ны х правил, разработанных в одной содержательной области, для подобных
по структуре проблем в других содержательных областях может быть одним
таким недостатком. Однако на уровне отдельного ученика рассматриваются
другие трудности, которые могут иметь еще большие недостатки.
Х отя структуру задачи трудно различить, а исходы - легко, они четко
видимы , доступны и часто однозначны. Рассмотрение закрепления с помо
щью обратной связи исхода необходимо в понимании того, к ак эвристика
сохраняется, несмотря на опыт. Кроме того, если исходы - в значительной
степени ф ункция структуры задачи, и у человека, принимающего реш ения,
недостаточно знания такой структуры , то правила, которые являю тся несо
ответствующими или даж е недостаточными, могут все еще укрепляться по
лож ительной обратной связью исхода. (Например, “суеверное” поведение
ж ивотны х при обучении; см. Staddon и Sim m elhag, 1971.)
П редставлены два примера, где нормативно неподходящ ая эвристика
мож ет привести к хорошим исходам и где может отсутствовать понимание
плохого качества правила. Рассмотрим человека, который в магазине под
ходит к банкам с соком со следую щ ими ценами и качеством (взято из
Tversky, 1969):
Задача вы бора 1
Рассмотрим общую задачу, вовлекающую не вероятностные оценки, так как
информация исхода каж ется к ак доступной, так и уместной в обеспечении
само-исправляющейся обратной связи. Задача, которую нужно рассмотреть
та, в которой оценки сделаны с целью выбора между альтернативными дей
ствиями. Н апример, рассмотрим ситуацию с двумя возможными действия
ми, А и В. Обозначим за х целое, оценочное суждением которое может само
быть ф ункцией различны х типов и количества информации. Кроме того,
пусть хс такой предел, что
Если х > х с, соверш аем действие А;
если х < хс, соверш аем действие В
Хоть оно и упрощ ено, уравнение 1 прим еняется ко многим ситуациям, а
такж е ситуациям оценки/реш ения, например: трудоустройство, продвиже
ние по служ бе, поступление в ш колу, предоставление кредита, назначение
на коррекционны е программы, участие в социальных программах, приня-
Ф а к т о р ы , в о зд ей ств у ю щ и е н а п о л о ж и те л ь н ы е п о п а д а н и я и л о ж
н ы е п о л о ж и те л ь н ы е
Рассмотрим Рисунок 2 снова и обратим внимание, что существуют три ф ак
тора, которые затрагиваю т пропорции положительных попаданий и лож
ны х позитивов; местоположение хс, ус, и “наклон” эллипса (который я в л я
ется корреляцией между х и у). Например, если хссмещен направо, а значе
н и я хс и рхупостоянны, имеется точка, в которой не будет никаких лож ных
позитивов. Конечно, будет соответствующее увеличение лож ны х негативов.
Получение знаний из опыта... 321
Однако если у человека нет информации относительно этих случаев (как
ситуации вообще), опыт успеха может убеждать, что качество оценивания
высоко. Поэтому, когда критерий для предоставления предпочтительного
действия поднят (увеличивая хс), вероятность того, что р (х > хс) (такж е на
зываемое отношением выбора, <р), уменьш ится, и это приведет к высокому
положительному попаданию и низким пропорциям ложных позитивов. Дру
гой ф актор, ус, очевидно влияет на исходы, так к ак уровень ус определяет
успех и неудачу. Обратите внимание, что когда значение ус пониж ается,
вероятность, что р (у > ус) (такж е назы ваем ая базовым значением, Ьг, уве
личивается, и опыт успехов мож ет быть высок независимо от способности к
оцениванию; то есть если бы вы наугад назначили людей для выполнения
различны х действий, вы бы получили пропорцию успеха, равную р (у > ус).
Поэтому, чтобы оценить способность к прогнозированию , должно быть про
ведено сравнение пропорции положительного попадания с р (у >уе), и спо
собность к оценке определена при незначительном увеличении в успехе. Тре
тий ф актор, р „ . прямо пропорционален исходам; то есть, чем больше pv .
тем больше процентное отношение полож ительны х попаданий.
Влияние этих трех факторов на процентное отношение положительных
попаданий хорошо известно. Тейлор и Расселл (Taylor & R ussell, 1939), на
пример, показали, что можно повысить процентное отношение положитель
ны х попаданий, для любых данны х рху и базового значения, путем умень
ш ения отнош ения выбора (<р), то есть, предоставляя предпочтительное дей
ствие меньш ему проценту людей (допустим, р v„ * 0). Таким образом, даж е
если р ху низкое, возможно получить высокое процентное отношение поло
ж ительны х попаданий, зависящ ее от величин (р и Ьг. Тейлор и Расселл (1939)
приводят таблицы процентных отнош ений положительных попаданий для
большого разнообразия значений р , <р и Ьг. Исследование этих таблиц по
казы вает, что н изкая корреляция между оценками и критериям и вполне
совместима с большим процентным отношением положительных попада
ний.
В дополнение к трем уж е упомянутым факторам необходимо рассмотреть
и четверты й ф актор. Он может быть проиллю стрирован с помощью следую
щего воображаемого эксперимента. Пусть о некоторых лю дях сделано не
которое множество оценок. Половину из тех, которые были оценены выш е
хс, наугад назначаем вы полнять действие А , а вторую половину - действие
В. Подобным образом поступаем с теми, чья оценка не превысила хс. Через
некоторое врем я измеряем поведение и подсчитываем пропорцию людей с
у > усв каж дой клетке (каж дому человеку приписано 1 или 0, чтобы обозна
чить, ниж е он или выш е предела у - пропорция, больш ая усв таком случае
просто среднее клетки). Это факторны й план 2x2, причем один фактор - это
“оценка”, а другой “тип действия”. Заметьте, что так как критерий не мо
ж ет быть измерен непосредственно перед решением (и действительно, если
это было бы так, то в оценке не было бы необходимости), люди, получающ ие
действия А и В, такж е получили различное экспериментальное воздействие.
322 КОВАРИАЦИЯ И КОНТРОЛЬ
Если бы этот эксперимент был проведен, можно было бы протестировать ос
новное влияние оценки (что измеряет его точность); основное влияние на
действие, то есть, влияет ли само получение А или В на поведение; и взаимо
действие между оценкой и действием. Обратите внимание, что преимущ е
ство эксперимента состоит в том, что он позволяет нам узнать точность оцен
ки из влияния отнош ения действия. К ак бы там ни было, такой экспери
мент редко проводится, даж е умозрительно, и, конечно ж е, он не проводит
ся лю дьми, не прош едш ими углубленное обучение планированию экспери
ментов. Таким образом, точность оценок всегда будет связана с возможным
влиянием отнош ения, обусловленного действием. Более того, ссы лаясь на
более раннее обсуждение, можно сказать, что этот эксперимент позволяет
проверить опровергающую информацию. В отличие от больш инства реаль
ны х оценочных задач, он позволил бы опровергнуть гипотезу точности оцен
к и , также как и оценить любое влияние отнош ения, обусловленного дей
ствием.
П ример влияния отнош ения показан на Н исунке 3. Эллипс, изображен
ны й пунктиром, тот ж е, что и был наН исунке 2, и он показы вает “истин
ное” взаимоотнош ение между оценками и исходами. Заш трихованная об
ласть обозначает наблюдаемые исходы; таким образом, показаны только зна
чения, для которы х х > хс. В лияние отнош ения проявляется в том, что ис
ходы (т.е. поведение) всех людей, которым было дано действие А , увеличе
ны на некоторую константную величину, так что количество полож итель
ны х попаданий больше, чем если бы она была при отсутствии эффекта отно
ш ения. С психологической точки зрения главны й аспект на Рис. 3 - это
то, характер обратной связи искаж ен, количество полож ительны х попада
ний резко увеличилось, а количество лож ных позитивов резко сократилось.
Y (поведение)
Заклю чен и е 2
Основной темой этой главы было, что информация исхода, без знания струк
туры задачи, может быть несоответствующей для обеспечения само-исправ-
ляю щ ейся обратной связи относительно неподходящ ей эвристики. Такж е
обсуждалось, что знание структуры задачи трудно достичь из-за индуктив
ного способа, которым мы получаем знания из опыта (см. Ham m ond, 1978,
Галилейевский способ мы ш ления против Аристотелевского). Эти выводы
поднимают две проблемы, которые будут кратко обсуждены.
М ожет быть, что даже со знанием структуры задачи, человек действует
таким способом, который меш ает получению знаний. Например, рассмот
рим официанта в ш умном ресторане. П оскольку у него нет времени, чтобы
обеспечить хорошее обслуживание всем клиентам, он делает прогноз, отно
сительно того, каки е клиенты оставят хорошие или плохие чаевые. Хоро
3 Смысл этой цитаты состоит в том, чтобы указать, что о т н оси т ельн ы е преимущества в
отношении окружающей среды важны. Мы не оскорбляем слепых людей. Том Воллстейн
сделал следующий комментарий, “В стране слепых, одноглазый человек может выжить,
только закрыв свой глаз, так как окружающая среда будет устроена так, что он будет пола
гаться на другие чувства”. Хотя это - очаровательный комментарий, я не соглашаюсь с ним,
потому что одноглазый человек имел бы другие чувства в дополнение к преимуществу зре
ния.
П о л уч ен и е зн а н и й из оп ы т а... 325
Часть VI
Чрезмерная уверенность
20. Чрезмерная уверенность в суждениях,
основанных на конкретных примерах*
Стюарт Оскамп
' Эта глава первоначально появилась в Журнале консультационной психологии (The Journal
of Consulting Psycohology), 1965, 29, 261-265. Авторское право © 1965 принадлежит Аме
риканской Психологической Ассоциации. Переиздано в соответствии с разрешением.
330 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
он не слиш ком уверен в себе. Относительно этой величины, которая может
быть названа правомерностью достоверности, было обнаружено, что опыт
ные “оценщ ики”, превосходят неопытных (Oskamp, 1962).
Многие исследования (Hamlin, 1954; H athaw ay, 1956; K ostlan, 1954 ;
Soskin, 1954; W inch & More, 1956) рассматривали влияние различного ко
личества информации стимула на клиническое принятие решений. В н а
стоящем эксперименте этот фактор изучался путем предоставления каж до
му испытуемому четырех множеств кумулятивно увеличивающегося коли
чества информации, как основания для принятия им решений. Таким об
разом, было смоделировано постепенное наращивание информации при ра
боте психолога над типичным случаем.
Исследовательские гипотезы были следующие:
1. После некоторого момента в процессе сбора информации, точность про
гнозирования достигает максимума.
2. Однако, уверенность в решениях продолжает устойчиво расти, посколь
ку получено большее количество информации.
3. Таким образом, к концу процесса сбора информации, большинство
испытуемых самонадеянны относительно своих оценок.
П роцедура
Так как было желательно, смоделировать обычную клиническую ситуацию настоль
ко точно, насколько возможно, в качестве информации, которая предложена ис
пытуемым, было выбрано реальное исследование. В конечном итоге, случай был
выбран из-за его обширности, из-за того, что он охватывал многие подходящие
ж изненны е случаи, и потому, что он описывал относительно нормального челове
ка (то есть случай неадаптированности молодого человека, который никогда не
помещался в психиатрическую лечебницу). Это был случай Джозефа Кидда (Joseph
Kidd), о котором сообщил Уайт (W hite, 1952) в своей книге “Ж изни в развитии”
(Lives in P rogress).1
Материалы относительно этого случая были организованы в хронологические
наборы информации, которые были представлены испытуемых в четыре последо
вательных этапа. Этап 1 содержал только следующую краткую демографическую
информацию относительно этого случая, чтобы проверить спрогнозированную точ
ность на уровень “психологической вероятности” (Patterson, 1955):
Д ж озеф у Кидду (псевдоним) - 29 лет. Он белый, не состоит в браке, явля
ется ветераном Второй Мировой Войны. Он - выпускник колледжа, рабо
тает бизнес-ассистентом в студии цветочной декорации.
На этапе 2 было добавлено полторы страницы материала, напечатанных через
один интервал, относительно детства Кидда до 12 лет. Этап 3 (2 страницы) рассмат
1Использование этого случая имело один недостаток. Несколько испытуемых помнили, что
они читали этот материал во время их обучения, но все кроме одного, сообщили, что их
более раннее знакомство никак не помогло им в этом исследовании. Так как их точность,
подтвердила это впечатление, их результаты были сохранены в анализе данных.
Чрезмерная уверенность в суждениях... 331
ривал его годы, проведенные в школе и колледже, а этап 4 ( 1 7 дстраницы) охваты
вали его службу в армии и более поздние действия до возраста в 29 лет.
аПравильный ответ.
Варианты ответов были построены только там, где имелись довольно объек
тивные информационные критерии, представленные в случае, ф актические
данные или хорошо зафиксированные выводы. Четыре неправильны х аль
тернативы в каж дом пункте были составлены аспирантами по психологии
посредством дополнения предложений к основе пункта. Они были построе
ны таким образом, чтобы быть явно неправильны ми, основанными на опуб
ликованном материале случая, но быть убедительными и “привлекатель
ны м и” альтернативами. Ни один из пунктов не содержал ответ, который
можно было обнаружить в полученном вводном материале случая. Испы
туемые долж ны были следовать обычной процедуре в клиническом приня
тии реш ений (С. M cA rthur, 1954), формируя картину индивидуальности
Кидда из представленного материала и затем прогнозируя его отнош ения и
типичны е действия, основываясь на картине его личности.
Эксперты
Эксперты были взяты из трех групп с разны м опытом в психологии: (а) 8
психологов, работаю щ их в государственной больнице ш тата К алифорния,
причем у каж дого было несколько лет опыта терапии, и 5 имели кандидатс
кую степень; 2(Ь) 18 аспирантов в области психологии;3и (с) б студентов стар
О ценки уверенност и
Оценки уверенности были сделаны , используя ш калу, изобретенную Адам
сом (Adam s, 1957), которая определяет уверенность в терминах ожидаемо
го процента правильны х реш ений. Так к ак было пять альтернатив для к аж
дого пункта теста, ш кала начиналась с 20% (что представляло полностью
случайный уровень достоверности) и заверш алась 100% (что указы вало на
абсолютную уверенность в правильности). В дополнение к обеспечению по
нятного объективного значения уверенности, эта ш кала имеет большое пре
имущ ество, т.к . позволяет напрямую сравнить уровень точности и уровень
уверенности. Таким образом, например, если у испытемого 28% пунктов
правильны е, а средний уровень уверенности 43% , он, безусловно, самоуве
рен.
Р е зу л ь т а т ы
Эта задача оценки, оказалась достаточно трудной, по крайней мере, для этого
материала о случае. Ни один испытемый не достиг точности 50% , и средняя
результирую щ ая точность была меньш е 28 % , со случайностью 20% (незна
чительное различие). Однако этот низкий уровень точности служ ит для того,
чтобы обеспечить еще более серьезное испытание гипотез исследования.
Бы л выполнен предварительный анализ, чтобы сравнить оценки трех
групп испытуемых, хотя не было сформулировано гипотез об их относитель
ны х результатах. Эти результаты ясно указали, что не было никаких сущ е
ственных различий между тремя группами испытуемых ни в точности, ни
в уверенности, ни в общем количестве измененных ответов. Полученные ре
зультаты уверенности на этапе 4 сравнивались с результатами предыдущих
исследований (Goldberg, 1959; Oskamp, 1962), показы вая, что более опы т
ные испытуемые, менее уверенны, чем менее опытные испытуемые, но в
этом исследовании эти результаты не приближ ались к значимым.
334 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Средние оценки
О б суж д ен и е
Необходимо избегать небрежного обобщения этих результатов. Имеются три
главны х ф актора относительно этого исследования, которые могли бы ог
раничить общность результатов, (а) случай может быть не похож на те, с
которыми большинство психологов привы кло работать. (Ь) П ункты теста
не могут представлять те виды поведения, которые психологи привы кли про
гнозировать. (с) Испытуемые, возможно, не были типичными представите
лями людей, принимаю щ их психологические реш ения. В ответе на эти воз
можные возраж ения должно быть указано, что случай, пункты теста и ис
пытуемые-психологи - все были выбраны с намерением приблизиться к си
туациям , встречаю щ имся в фактической психологической практике.
Д аж е если эти возможные возраж ения могут быть предоставлены, неко
торые четкие заклю чения могут быть сделаны. Независимо от того, к аза
лась ли задача странной или материалы случая нетипичными, оценки уве
ренности испытуемых показы ваю т, что они убедились в увеличении своего
понимания случая. П оскольку они получили большее количество инфор
мации, их уверенность резко возросла. Более того, их уверенность относи
тельно собственных реш ений стала обратно пропорциональна фактической
правильности этих реш ений.
Таким образом, хотя этот результат не может повторяться для каж дого
психолога и каж дого типа реш ений, можно четко заклю чить, что усили
П р о ц ед у р а п р ям о й о ц ен к и к в а н т и л я
Пусть х* - истинное, целевое значение некоторой переменной, и предполо
ж им, что оно неизвестно оценивающему, i f -тый оценочный квантиль х* (для
к в интервале от 0 до 1) - это число хк, которое означает, что оценочная веро
ятность того, что он припиш ет событию {х* < хк}равна k; в терминах вероят
ности, Р {х* < хк}= к. Н а числа х0 50, х025 и х075будут ссы латься как на оце
ночную медиану, ниж ний квартиль и верхний квартиль, соответственно.
* Эта глава первоначально появилась в 1969 как неопубликованное сообщение. Она была
пересмотрена специально для этой книги.
338 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Чтобы получить х0 ж, испытуемый долж ен представить такую величину,
которая настолько ж е вероятна, что х* к ак ниж е х0 ^ так и выш е - х050.
Таким образом, х0 50делит континуум на два оценочных, одинаково вероят
ны х интервала. Более низкий квартиль, х025, делит интервал (-°°, х 50) на
два оценочных одинаково вероятных интервала; и верхний квартиль, х0 75,
делит интервал (х0 50, + оо) на два оценочных интервала с одинаковой вероят
ностью. Д ля каж дой неопределенной величины , наш их участников экспе
римента попросили определить их оценочную медиану и квартили. После
довательность (или “когерентность”, к ак предпочитают писать некоторые
авторы) требует, чтобы испытуемый считал, (а) что каж ды й из этих четы
рех интервалов
В о зм о ж н о сть вн еш н ей в а л и д и за ц и и
Если все, что мы имеем от данного испытуемого, это одно распределение ве
роятности для единственной неопределенной величины , было бы бессмыс
ленно говорить, что его распределение “неправильно”. Мы могли бы наде
яться, что наш испытуемый более хорошо осведомлен о рассматриваемой
величине, но его распределение вероятности только формальное вы раж е
ние того, что он знает или не знает об этой величине. Мы не можем сказать,
например, что его распределение “слиш ком компактное”, или “слиш ком сво
бодное, “ или “слиш ком смещено вправо”. Но, в отличие от этого случая,
допустим, что наш испытуемый дает нам ты сячу распределений ты сячи раз
личны х неопределенных величин. Если каж дое из ф актических истинных
значений должно попадать либо ниж е его соответствующего 0.01 кванти
л я, либо выш е его 0.99 квантиля, то мы сможем сказать, что он внеш не не
Сообщение о процессе обучения оцениванию... 339
ограничен, что его распределения имеют тенденцию быть слиш ком ком пак
тными. И ли, напротив, если бы было так, что каж ды й из его оцененных
меж квартильны х диапазонов содержал бы истинную величину, то это обо
значало бы его тенденцию быть слиш ком разреж енны м. Допустим, что это
экстремальны е случаи, но они устанавливаю т то, что возможно и уместно
говорить о внеш ней валидизации множества распределений вероятности.
Ц ели у п р аж н е н и й и со став гр у п п и сп ы ту ем ы х
Не вдаваясь в подробности, позвольте нам предоставить краткий обзор того,
что мы сделали. Посредством ряда анкет мы опросили большое количество ис
пытуемых (приблизительно тысячу) и записали их оценочные квантили для
нескольких величин, неизвестных им во время оценки. Затем мы сравнили их
оценки с фактическими истинными значениями; идентифицировали некото
рые постоянные предубеждения; исследовали формальные процедуры для из
менения их оценочных входных данных; проинформировали каждого испы
туемого о качестве ответов группы и его собственного специфического набора
ответов; и, наконец, мы предложили способы, которыми кажды й испытуемый
мог получить информацию о прошлых индивидуальных особенностях и, та
ким образом, изменить свой последующий набор оценок.
Мы провели четыре отдельных, но связанны х упраж нения в течение ака
демического года 1968-1969, и для идентификации, перечислим их:
Группа 1: 139 студентов факультативного курса “Модели плани
рования в условиях неопределенности”, второй курс программы на
степень магистра бизнес-управления (МБУ) Гарвардского универси
тета.
Группа 2 :8 0 0 студентов, вклю чаю щ ая всех первокурсников про
граммы МБУ Гарварда.
Группа 3 : 67 “добровольцев” с углубленного курса менеджмента
на бизнес-факультете Гарварда.
Группа 4: 60 студентов, проходящ их курс анализа принятия ре
ш ений, который осущ ествлялся в аспирантуре точных и гумани
тарны х наук в Гарварде. Это были студенты различны х ф акульте
тов в Гарварде и Технологическом институте ш тата Массачусетс и
изучали экономику, статистику, инженерию , математику, юрисп
руденцию, управление, дизайн, общественные отнош ения, опера
ционный анализ.
До принятия участия в этом исследовании, все испытуемые в этих четы
рех группах изучали основные принципы анализа принятия решений: по
строение и анализ схем принятия реш ений, предшествующие и последую
щ ие распределения вероятности, теорию полезности (или предпочтений) и
величину информации.
340 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Н а группе 1 проводилось пилотажное исследование. От каж дого студен
та требовалось независимо оценить распределения для 20 неопределенных
величин. Д ля этой группы мы изменяли наш и инструкции о вероятности
“хвоста” распределения; это обсуждается позже в этой главе. Все 20 оценок
были проведены за одно испытание без обратной связи.
С группами 2, 3 и 4 было проведено нечто подобное. В первом испытании
каж дом у испытуемому предлагали оценить 10 неопределенных величин.
Затем испытуемых информировали относительно результатов всей группы
и их собственных результатов. Затем осущ ествлялось следующее испы та
ние с 10 различны ми неопределенными величинами.
Д ействия группы 1 и групп 2, 3 и 4 в первых испы таниях были в значи
тельной мере сходны. Действия групп 2, 3 и 4 во втором испы тании, после
информирования и обратной связи, были снова чрезвычайно подобны; но
заметные улучш ения были отмечены между их первыми и вторыми испы
таниям и. И з-за подобия действий всех групп мы обсудим и сделаем замеча
ния по детальным результатам самой большой из этих групп.
У п р а ж н е н и е и р е зу л ь т а т ы , п о л у ч ен н ы е до о б р атн о й с в я зи
Мы воспроизводим инструкции, которые были предоставлены половине уча
щ ихся курса МБУ (группа 2). Эта подгруппа получила то, что мы назвали фор
мой В; другая половина получила форму А, которая была идентична по содер
жанию , но в которой были приведены другие неопределенные величины.
Инструкции: форма В
Цель этого упражнения состоит в том, чтобы увидеть, насколько хорошо Вы как
представитель группы и группа в целом можете оценивать распределения вероят
ности для неопределенных величин (НВ). Мы приведем ниж е 10 НВ, и Вас попро
сят оценить медиану, 0.25 квантиль, 0.75 квантиль и значения экстремума каж
дой НВ. (Для вашего удобства краткие определения этих терминов даются ниж е.)
Благодаря типу используемой НВ, Вы сможете сравнить Ваши оценки с истинны
ми значениями. Таким образом, Вы сможете увидеть, склонны ли Вы делать рас
пределение “слишком плотным”, “слиш комразреженным” или смещенным вверх
или вниз в определенных типах вопросов. П озж е Вас попросят повторить это уп
ражнение с другими НВ. Для этого упражнения Вы должны независимо ответить
на вопросы, не просматривая исходные материалы, хотя для некоторых вопросов
желательно произвести простые вычисления. На интересует Ваше знание незави
симо от того, насколько оно неопределенно или насколько неудобно Вы себя чув
ствуете.
Определения квантилей...
Н иж е приведено 10 величин, которые, как мы надеемся, для Вас являются
неопределенными. Вы должны записать Вашу оценку на каждом бланке ответа.
Заполните каждый пункт настолько хорошо, насколько Вы можете с нынешними
знаниями, но не ищите дальнейшую информацию и не обсуждайте вопросы о соот
ветствии со своими партнерами даж е после того, как Вы сдадите свои ответы. Вам
необходимо сдать один бланк ответов перед занятиями завтра, а второй оставьте
Сообщение о процессе обучения оцениванию... 341
себе так, чтобы у Вас была запись Ваших ответов. (Студенты использовали сохра
ненный экземпляр, чтобы оценить себя. Это будет описано позж е.)
Вопросы
A. Вы предпочитаете бурбон или скотч?
B. Вы одобряете отсрочки от армии для всех аспирантов независимо от области
деятельности?
C. Приняли бы Вы участие в азартной *игре “50 на 50”, где Вы могли бы либо
проиграть $ 50 или выиграть $ 100?
(Новая страница)
Форма В (бланк, который нужно сохранить)
Секция____
Номер студента______
П ожалуйста, выберите один ответ для каждого из вопросов А , В и С:
A . Напиток бурбон (1) Скотч (2) Не пью вообще (3)
B. Отсрочка от армии одобряю (1), выступаю против (2)
C. Азартная игра 50-50 принимаю__ (1), отклоняю__ (2)
342 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
П ожалуйста, оцените все 5 величин для каждой из этих 10 переменных, приве
денных ниж е. Заметьте, что самое высокое число в каждой строке находится спра
ва. (Десятичные дроби в ответах допускаются. Если необходимо указать процент,
ответы должны иметь форму 97.2 для 97.2% , а не 0 .972.)
Приблизительно через неделю после того, как студенты заполнили форму В, сту
дентам был предложена следующее информационное сообщение. Оно обсуждалось
в группе до того, как студентам дали для заполнения форму А.
Цель этого информационного сообщения:
1. Описать в совокупности поведение людей, заполнивших форму В,
2. Указать систематические предубеждения в ответах,
3. Позволить Вам проверить себя прежде, чем Вы повторите это упражнение в
форме А.
3 Азартная игра
50-50 11 8 28 29 13 11 100
4 Израиль 51 41 6 1 1 0 100
Профсоюз
5 1 1 13 28 29 28 100
учителей
6 Список докторов 24 14 12 13 10 27 100
7 Докторанты 1 3 11 9 15 61 100
Производство 2 58
8 яиц 9 13 10 8 100
Импортирован 15 18 9 26
9 ные машины 25 7 100
10 Доход с канала 18 8 8 12 16 38 100
Всего 158 120 164 170 120 268 1.000
Ожидае
мая 10 240 250 250 240 10 1.000
частота
Ожидаемое количест во
М ежеквартальное Ф актическое
человек, использующ их
множество количест во человек
р —0 3 3
0 3 1.9
1 10 9.0
2 22 19.9
3 20 26.1
4 23 22.5
5 11 13.3
6 9 5.5
7 2 1.5
8 0 0.3
9 0 0.0
10 0 0.0
Всего 100 100.0
А нализ экстремумов
Возможно, Вы устанавливаете Ваши квантили 0.01 и 0.99 так, чтобы Вы
были “удивлены ” действительно низким ответом (ответ категории 1) и дей
ствительно высоким ответом (ответ категории б). В 1.000 вопросах мы дол
ж ны были “ож идать” в общем 20 таких сюрпризов, 10 слева и 10 справа (см.
табл. 2). Было в общем 426 сюрпризов! Это должно не просто удивить нас, а
ш окировать! Вы можете немного успокоиться, хотя бы потому, что Вы не
столь плохи к ак группа второкурсников (группа 1), о которой мы упомина
346 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ли. П риблизительно 35 студентов попросили, к ак и Вас, перечислить кван
тили 0.01 и 0.99 для 20 вопросов. Они записали 46% сюрпризов - немного
хуж е, чем ваш и 42,6% . Других 35 студентов попросили записать 0.001 и
0.999 квантили и вместо “ож идаемы х” 0,2% сюрпризов они записали 40% .
Д ругих 35 попросили в довольно неопределенных терминах, перечислить
“миним альны е” и “максимальны е” значения - мы действительно не знаем,
что это означает - и они сделали запись 47% сюрпризов. Н аконец других 35
попросили дать “удивительно низкие” и “удивительно высокие” значения,
и они отметили 38% сюрпризов. Очевидно, “удивительнонизко”, ниж е, чем
“минимум”.
Ради Бога, Расширьте свои экстремумные квартилиХ Будьте честными с
самим собой! П ризнайте то, что Вы не знаете!
Рассмотрим 6-й вопрос 2 .6 0 0 докторов в области медицины перечислены
в телефонном справочнике Бостона и его окрестностей. Половина из Вас была
удивлена этим результатом. Некоторые были удивлены тем, что это такая
больш ая цифра, другие, что - маленькая. П ятьдесят восемь процентов были
удивлены фантастически большим количеством произведенных яиц - но все-
таки 9% были одинаково удивлены фантастически маленьким количеством.
Ожидаемое число
Ф актическое
И ндекс неож иданности человек, использующ их
количест во человек
р = ОАЭ
0 1 0.4
1 9 2.7
2 15 9.3
3 13 18.7
4 17 24.6
5 15 22.3
6 16 14.0
7 4 6.0
8 9 1.7
9 1 0.3
10 0 0.0
Всего 100 100.0
Д лина категории 10 5 10
1 Пусть 1. определяет длину категории 1. Мы имели бы бимодальность, если бы 12; и 15, каж
дый был бы меньше, чем (13 + 14) /2 .
348 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Таблица 6. Сравнения результатов испытаний 1 и 2
______ Группа 3_____________ Группа 4______
Испытание Испытание Испытание Испытание
__________________________________ 1__________ 2__________ 1__________ 2
Значения, попадающие
внутрь межквартильных 33.4 44.8 35.6 42.5
диапазонов (%)
Значения, не попадающие в
диапазоны от 0.01 до 0.99 35.6 22.8 20.8 8.7
(%)
В выш еупомянутой иллю страции отношение длин вероятностного интер
вала 0.98 (от квантилей 0.01 до 0.99) к вероятностному интервалу 0.50 (от
квантилей 0.25 до 0.75) равняется (45-5) / (40-15) или 1.6. Это слиш ком м а
ленькое число для унимодальной кривой. Например, для нормальной пара
болы это отнош ение - приблизительно 3.5. Отношения от 2.25 до 4.5 могут
служ ить к а к схем атическая директива, но директивы долж ны наруш аться
время от времени. Помните: расш иряйте свои распределения!
Р е з у л ь т а т ы , п о л у ч ен н ы е п о сл е о б р атн о й с в я зи
После обсуждения в группе докладной записки об обратной связи, мы поме
няли формы и повторили упражнение. После анализа ответов, мы раздали
следующее информационное сообщение:
Информационное сообщение № 2
К аж ды й из Вас уж е принимал участие в следующем:
a. (испытание I): Вам давали одну из двух форм (А или В) и Вы представи
ли квантиль оценки для десяти неопределенных величин;
b . (обратная связь): Вам дали истинные значения этих десяти квартилей
и попросили записать два фактора: (1) сколько из Ваш их ответов попали в
ваш и интерквартильны е диапазоны , и (2) сколько Ваш их ответов не попа
ли в ваш и диапазоны 0.01 и 0.99. Вы были такж е информированы об общем
вы полнении работы группой: П риблизительно вдвое больше ответов не по
пали в интерквартильны е диапазоны , чем попали, и было действительно
ш окирую щ ее число сюрпризов - около 40% ответов попало вне диапазонов
0.01 и 0.99.
c. (И спытание 2): Вам дали другую форму и попросили представить оцен
к и квантилям .
Мы вы числили Ваши ответы для части (с) и готовы прокомментировать
Вашу совокупную работу. Но, прежде всего, мы перечислим истинные значе
ния неопределенных величин так, чтобы Вы могли проверить себя (таблица,
представляю щ ая эту информацию, была показана в докладной записке).
Сообщение о процессе обучения оцениванию... 349
И нтерпрета- Пропорция
И нт ерпрет а
Р азм ер выборки неожидан
ция "низко" ция "вы соко "
ностей
0.01 квантилями 0.99 квантилями 44 0.46
0.001 квантилями 0.999 квантилями 25 0.40
Минимальное Максимальное 35
значение 0.47
значение
Удивительно Удивительно 35
низко высоко 0.38
Е щ е н ес к о л ь к о сл о в об эк с тр е м у м н ы х “ х в о с т а х ”
В экспериментальном исследовании (группа 1) мы изменили инструкции
относительно экстремумных “хвостов”, чтобы увидеть, какое влияние это
будет иметь на статистические распределения ответов. Всех наш их субъек
тов, однако, попросили дать медиану оценки и два квартиля. Н аш и резуль
таты собраны в табл. 7 и 8, которые мы объясним по очереди.
И з 139 испытуемых, сорок четы рех попросили дать 0.01 и 0.99 кванти
ли, и эта подгруппа зарегистрировала 46% неожиданностей (а не 2% ); 25
попросили дать 0.001 и 0.999 квантили, и эта подгруппа зарегистрировала
40% неожиданностей (а не 0.2% ). Тридцать пять испытуемых попросили
дать “минимальное значение” и “максимальное значение”, и когда некото
рые испытуемые попросили разъяснить, что эти термины означают, мы ук
лончиво заметили, что “конечно, это неопределенные термины, но попытай
тесь ответить на вопросы так или иначе”. Мы дали тот ж е самый неоднознач
ный совет оставшимся 35 испытуемым, которых спросили относительно “уди
вительно низких” и “удивительно высоких” значений. Последние две груп
пы зарегистрировали 47% и 38% соответственно. Различны е инструкции
имели определенное влияние, но, как Вы видите, не очень сильное.
* Калибровка - (тех.) это процесс или результат настройки технического устройства для
повышения точности его работы.
352 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
реали зм а уверенности (Adam s и A dam s, 1961), уместности уверенности
(Oskam p, 1962), вторичной валидности (M urphy и W inkler, 1971) и надеж
ности (M urphy, 1973). Ф ормально, оцениваю щ ий “проверен”, если, по мно
гим испы таниям , для всех предположений с заданной вероятностью ,оце
ненная вероятность равна заданной. К алибровка экспертов может быть оп
ределена опытным путем, наблю дая их оценки вероятности, проверяя вза
имосвязанны е предположения, а затем наблю дая пропорцию, истинную в
каж дой категории ответа.
Э кспериментальная литература по калибровке людей, экспертов по ве
роятности дискретны х предположений, рассмотрена в первом разделе этой
главы . Второй раздел описывает калибровку функций плотности вероятно
сти, проведенную для неопределенных числовых величин. Х отя калибров
к а - по сущ еству свойство человека, большинство исследований, рассмот
ренны х здесь, представляет данны е, сгруппированные по экспертам для
обеспечения большего количества данны х, необходимых для устойчивых
оценок калибровки.
Д и с к р е т н ы е п р ед п о л о ж ен и я
Д искретны е предполож ения могут быть охарактеризованы согласно коли
честву альтернатив, которые они предлагают:
1 N
В = Т7 L (.ri-CiKn-Ci)
™ i= l
»t
Ct = <сй,......Cjt, .......c h ), где c jt = % c jt / n t
Н аконец, пусть и будет вектор единства (the u n ity vector), вектор строки,
чьи к элементы - все единицы.
Тогда разделение Мерфи оценки Байера:
- ' \ т — — ' \ т — - —
В = с(и - с) + — X nt(rt - ctXrt - ct ) - — £ nt(ct - c \c t - c)
N t=i N t=i
- - l J T — 2 1 — - 2
В' = с ([- с ) + — 1 я ( ( г . - с , ) ------ 2 ) л . ( с , - с )
jV <“1 N t=*
М етеорологическое исследование
В 1906, В. Эрнест К ук, правительственный астроном в Западной А встра
лии, вы сказал точку зрения, что каж ды й метеорологический прогноз дол
жен сопровождаться единственным числом, которое “указы вало бы, при
близительно, степень вероятности, которую сам метеоролог приписывает
этому предсказанию ” (Cooke, 1906b, с. 274). Он сообщил о результатах 1.951
предсказаний (Cooke, 1906а, 1906b). И з тех, которым он приписал самую
высокую степень вероятности (“почти уверен, что правильно”), 0.985 были
правильны. Д ля средней степени вероятности (“средняя вероятность”), 0.938
были правильны ми, в то время к ак для самой низкой степени вероятности
(“сомнительный”), 0.787 были правильны .
В 1951, У ильямс (W illiam s) попросил восемь профессиональных метео
рологов в Солт-Лейк-Сити оценить вероятность выпадения осадков для к аж
дого из 1 0 9 5 12-часовых прогнозов, используя одно из чисел 0 ,0 .2 ,0 .4 ,0 .6 ,
0.8 и 1.0. Почти по всему диапазону, доля дней с осадками бы ла ниж е, чем
приписанная вероятность. Это могло бы отраж ать довольно естественную
форму перестраховки в публичных утверж дениях. Лю ди, намного более
вероятно, будут критиковать прогноз погоды, который оставит их в дождь
без зонтика, чем прогноз, прислуш авш ись к которому они носили зонтик в
дни без осадков.
Подобные результаты показало исследование Мерфи и У инклера (M urphy
и W inkler, 1974). Их метеорологи дваж ды оценили вероятность вы падения
осадков на следующий день, к ак до, так и после наблю дения результатов
компью теризированной системы предсказания погоды (PEATMOS). Эти
7.188 оценок (как до, так и после PEATMOS) показали ту ж е самую пере
оценку вероятности дож дя, обнаруженную Уильямсом (W illiam s).
Сандерс (Sanders, 1958) собрал 12.635 прогнозов, используя 11 ответов 0,
0 .1 ,..., 0 .9 ,1 .0 , для следующих дихотомизированных событий: направление
356 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ветра, скорость ветра, порывы, температуры, облачность, высота облачнос
ти, видимость, выпадение осадков, тип осадков и гроза. Эти данные показали
только небольшую тенденцию оценок вероятности синоптиками превыш ать
пропорцию погодных событий, которые произош ли.1 Рут (Root, 1962) сооб
щ ил о симметричности калибровки 4.138 прогнозов осадков: приписанные
вероятности были слиш ком низки в низком диапазоне и слиш ком высоки в
высоком, относительно наблюдаемых частот.
У инклер и Мерфи (W inkler и M urphy, 1968а) сообщили о калибровоч
ны х кривы х за год прогнозов осадков в Хартфорде, ш тат Коннектикут. К аж
ды й прогноз был либо для 6-часового, либо 12-часового периода времени, с
временем подготовки от 5 до 44 часов. К сожалению , было неясно, вклю чи
ли ли синоптики “признаки осадков” (меньше чем 0.01 дюйма) в свои пред
сказания. Данные были проанализированы дважды, предполагая, что “осад
к и ” вклю чаю т или не вклю чаю т признаки. Вклю чение или исклю чение
признаков имело существенное влияние на калибровку, к ак и временной
период. 6-часовые прогнозы с признакам и и 12-часовые прогнозы, и без при
знаков, показали превосходную калибровку. К ривая калибровки для 12-
часовы х прогнозов с признакам и располагается выш е линии идентифика
ции; кри вая для 6-часовых прогнозов, без признаков, леж ит значительно
ниж е ее. Разница во времени подготовки не затрагивала калибровку.
1 Ссылки на Кук (Cooke ,1906), Вилльямс (Williams, 1951) и Сандерс (Sanders, 1958) были
предоставлены нашему вниманию Раиффом (1969).
Калибровка вероятностей... 357
Н ациональная метеорологическая служ ба вы раж ает свои прогнозы воз
никновения осадков в вероятностных терминах, начиная с 1965. Бы ла опуб
ликована калибровка для некоторых частей этой массивной базы данных
(M urphy и W inkler, 1977а; А мериканское метеорологическое бюро, 1969).
За эти годы калибровка улучш илась. Рисунок 1 показы вает калибровку для
24.859 прогнозов осадков, сделанных в Ч икаго в течение четы рех лет, за
канчивая июнем 1976. Он показы вает очень хорошую калибровку; Мерфи
(M urphy, 1980) утверждает, что данные, полученныев течение недавних лет,
даже лучше! Он приписывает лучш ее выполнение работы опыту в оценке
вероятности, которы й синоптики приобрели за эти годы, а такж е тому ф ак
ту, что эти данные были собраны на реальной ситуации на рабочем месте.
L nt \ rt ~ ct 1.
^ y
3Любители MMPI могли бы обратить внимание, что с этим минимальным обучением стар
шекурсники показали столь же высокую точность как лучшие эксперты или лучшие систе
мы прогнозирования.
360 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ными для плохо понятных слов и неуверенными для хорошо понятных слов.
П оллак и Декер (Pollack и Decker, 1958) использовали устно определен
ную 6-ти бальную ш калу уверенности, от “Я уверен, что я получил сообще
ние правильно” до “Я уверен, что я получил сообщение неправильно. ” С этой
ш калой оценки невозможно определить, хорошо ли калиброван индивиду
ум, но возможно увидеть изменения в калибровке во всех условиях. Кривые
калибровки для легких слов обычно леж ат выше кривы х калибровки для
трудных слов, независимо от отношения “сигнал-пгум”, и кривы е для высо
ких значений отношения “сигнал-ш ум” леж ат выше кривы х для низких зна
чений отнош ения “сигнал-ш ум”, независимо от трудности слова.
В больш инстве этих исследований, калибровка мало интересовала иссле
дователей; важ ны м вопросом было то, не дадут ли оценки уверенности те
ж е самые кривы е ОХП что процедуры “да-нет”. К 1966, Грин и Свите (Green
& Sw ets) заклю чили, что ш калы оценок и процедуры “да-нет” дают почти
идентичны е кривы е ОХП. С тех пор, исследования калибровки исчезли из
литературы по обнаружению сигнала.
Ответы испытуемых
Ответы испытуемых
Рис. 4. Влияние на калибровку изменений в проценте истинных ут
верждений (.Источник: Fischhoff и L ichtenstein, неопубликовано)
Н еп р ер ы в н ы е п р ед п о л о ж ен и я : н ео п р ед ел ен н ы е в е л и ч и н ы
Метод к ва н т и ля
Неопределенность значения неопределенной непрерывной величины (на
пример, к ак ая доля студентов предпочитает скотч бурбону? Каково самое
короткое расстояние от А нглии до А встралии?) может быть вы раж ена к ак
ф ункция плотности вероятности для возможных значений этой величины.
Однако экспертов обычно не просят строить всю функцию . Вместо этого,
370 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
обы чная процедура - некоторая разновидность метода кван ти ля. В этом
методе оцениваю щ ий задает значения неопределенной величины , которые
связаны с м аленьким количеством предопределенных квантилей распреде
ления. Д ля медианы или квантиля 0.50, например, оцениваю щ ий задает
такое значение величины , что истинное значение, с равной вероятностью
будет попадать выш е или ниж е заданного значения; квантиль 0 .0 1 - это та
кое значение, что существует только 1 шанс из 100, что истинное значение
является меньш им, чем заданное. Обычно оцениваю тся три или пять кван
тилей, вклю чая медиану. В варианте под названием метод тертилей, оце
ниваю щ ий задает две величины (0.33 и 0.67 квантили) такие, что полный
диапазон разделен на три одинаково вероятных секции.
Обычно регистрирую тся два измерения калибровки. Межквартилъный
индекс - процент вопросов, для которых истинное значение попадает в меж-
квартильны й диапазон (то есть, между квантилям и 0.25 и 0.75). Полнос
тью калиброванны й человек будет, в конечном счете, иметь меж квартиль-
ный индекс 0.50. Индекс неожиданности - это процент истинны х значе
ний, которы е не попадают в крайние оцененные квантили. Когда наиболее
крайние квантили оценены к ак 0.01 и 0.99, полностью калиброванный че
ловек будет обладать индексом неожиданности 2. Больш ой индекс неож и
данности показы вает, что границы уверенности экспертов были слиш ком
узким и, чтобы охватить достаточно истинны х значений, и таким образом,
указы вает на самонадеянность (или гиперточность; P itz, 1974). Неуверен
ность будет обозначена меж квартильны м индексом больше 50 и низким ин
дексом неожиданности; ни о каки х подобных данны х не сообщалось в лите
ратуре.
Импульс для исследования калибровки ф ункций плотности вероятнос
ти появился в 1969 в книге А льперта и Рейфа (A lpert и R aiffa, 1969, 21).
А льперт и Рейфф а работали со студентами бизнес ф акультета Гарварда, к о
торые были знакомы с анализом принятия реш ений. В группе 1, все испы
туемые оценивали пять квантилей, три из которы х были 0.25, 0.50 и 0.75.
Крайние квантили различались для четы рех подгрупп; 0.01 и 0.99 (группа
А); 0.001 и 0.999 (группа В); “м иним альная возмож ная величина” и “м ак
сим альная возмож ная величина” (группа С); и “удивительно н и зкая вели
чин а” и “удивительно вы сокая величина” (группа D). М еж квартильны е ин
дексы и индексы неожиданности для этих четы рех подгрупп показаны в
табл. 1. Разочарованные большим количеством случаев неожиданности, А ль
перт и Рейффа провели эксперимент с тремя дополнительными группами (2,
3 и 4) которые, после оценки 10 неопределенных величин, получили обрат
ную связь в форме расширенного сообщения и объяснения результатов, н а
ряду с призывом “Расш ирьте ваш и крайние квантили!” Затем испытуемые
ответили на 10 новых неопределенных величин. Результаты до и после полу
чения обратной связи показаны в табл. 1. Результаты улучш ились, но испы
туемые все ещ е показы вали значительную самонадеянность.
Калибровка вероятностей... 371
Хессиан и М акКарти (Hession и M cCarthy, 1974) собрали данные, сопоста
вимые с первым экспериментом Альперта и Рейффы, используя 55 неопреде
ленных величин и 36 аспирантов в качестве испытуемых. Их инструкции
вынудили испытуемых убедиться, что интервал между квантилем 0.25 и кван
тилем 0.75 действительно захватывает половину вероятности. “Более позднее
обсуждение с отдельными испытуемыми прояснило, что эта проверка после
довательности закончилась в большинстве случаев реорганизацией, умень
ш ая первоначально оцененный межквартильны й диапазон” (с. 7) таким об
разом, все только ухудшилось! Этот акцент на обучение, не используемый
Альпертом и Рейффом, может объяснять, почему испытуемые Хессиан и М ак
Карти были так плохо калиброваны , к ак показано в Таблице 1.
П и к х а р т и В о л л е й с ( P ic k h a r d t
& W a lla c e , 1 9 7 4 )
Группа 1
Первое испытание ? 39 32 2
Пятое испытание ? 49 20 2
Группа 2
Первое испытание ? 30 46 2
Шестое испытание ? 45 24 2
Т. А . Б р а у н (Т .А . B r o w n ,1 9 7 3 ) 414 29 42 2
Л и х т е н ш т е й н и Ф иш хоф ф
(L ic h te n s te in & F isc h h o ff,
1980b)
До испытания 924 32 41 2
После испытания 924 37 40 2
С и вер, ф он В и н т е р ф е л ь д т и
Э д в а р д з (S e a v e r , v o n
W in te r f e ld t & E d w a r d s , 1 9 7 8 )
Квантили 160 42 34 2
Вероятностные квантили 160 53 24 2
Вероятности 180 57 5 2
Шансы 180 47 5 2
Протокол шансов 140 31 20 2
Ш еф ер и Б о р ч е р д и н г (S c h a e fe r и
B o rc h e rd in g , 1 9 7 3 )
Первый день, квантили 396 23 39 2
Четвертый день, квантили 396 38 12 2
Первый день, гипотетическая 50 2
396 16
выборка
Четвертый день, 6 2
396 48
гипотетическая выборка
Л а р со н и Р и н а н (L arson &
R eenan, 1 9 7 9 )
"Вполне уверен" 450 42 ?
П р е т т (P r a tt, 1 9 7 5 )
"Удивительно высокие/ 175 37 5 ?
низкие" значения
Калибровка вероятностей... 373
Продолжение табл. 1
М ер ф и и В и н к л е р (M u r p h y и
W in k le r , 1 9 7 4 )
Экстремумы 0.125 и 0.875 132 45 27 25
М ер ф и и В и н к л е р (M u r p h y и
W in k ie r , 1 9 7 7 b )
Экстремумы 0.125 и 0.875 432 54 21 25
Штаел фон Хольстен (Stael von
1,269 27 30 2
Holstern, 1971а)
Д ругие методы
Сивер, фон Винтерфельдти Эдвардз (Server, von W in terfeld tи Edw ards, 1978)
изучали влияние пяти различны х способов ответа на калибровку. Две груп
пы использовали метод одного квантиля, либо пяти квантилей (0 .0 1 ,0 .2 5 ,
0.50, 0.75, 0.99), либо эквиваленты вероятности этих квантилей (1 :9 9 ,1 :3 ,
1:1, 3:1, 99:1). Три других группы отвечали вероятностями, ш ансами или
заполняли протоколы шансов н а одно-альтернативные вопросы, которые
определяли некоторое значение неопределенной величины (например, “К а
кова вероятность того, что население Канады в 1973 превысило 25 милли
онов?”). П ять таких установленных значений давались для каж дой неопре
деленной величины , и, исходя из ответов, экспериментаторы оценивали
м еж квартильны е индексы и индексы неожиданности. Д ля каж дого мето
да, семь из девяти студентов отвечали н а 20 неопределенных величин. Как
показано в Таблице 1, группы, дающие вероятностные ответы и ответы ш ан
сов, показали лучш ие индексы неожиданности, чем испытуемые, исполь
зующ ие метод квантиля. Н еясно, появляется ли это превосходство из-за ин
ф орм ации, сообщенной значениям и, которы е вы брал экспериментатор.
Способ ответа на протоколы ш ансов не функционировал должным образом.
Ш ефер и Борчердинг (Schaefer и B orcherding, 1973) попросили 22 сту
дентов оценить 18 пропорций, сделанных группой, в каж дом из четырех ис
пы таний. К аж ды й испытуемый использовал два метода оценки: (а) метод
квантиля (0.01, 0 .1 2 5 ,0 .2 5 ,0 .5 ,0 .7 5 ,0 .8 7 5 ,0 .9 9 ), и (Ь) метод гипотетичес
ки х выборок. В последнем методе, оцениваю щ ий задает размер, п, и число
успехов, г, гипотетической выборки, которая лучш е всего отраж ает знание
376 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
экспертов неопределенной величины (то есть, я чувствую себя столь ж е уве
ренны м относительно истинного значения пропорции, к ак я чувствовал бы
себя, если бы я наблюдал выборку из п событий с г успехами). Больш ие зна
чения п отраж аю т большую уверенность относительно истинного значения
пропорции. Отношение r/п отраж ает среднее значение функции плотности
вероятности. Испытуемые испы ты вали большие трудности в этом методе,
несмотря на инструкции, которые вклю чили примеры бета распределений,
леж ащ их в основе этого метода. После каждого испытания, испытуемым пред
лагали обширную обратную связь, с акцентом на их собственной калибровке
и калибровке группы. Результаты первого и последнего испы тания показа
ны в табл. 1. Улучш ение было обнаружено для обоих методов. Результаты ме
тода гипотетических выборок, в начале давал результаты хуж е (50% неожи
данностей и только 16% в межквартильном диапазоне), а в конце лучш е (6%
неожиданностей и 48% в межквартильном диапазоне), чем метод квантиля.
Б арклей и Петерсон (B arclay и P eterson, 1973) сравнили метод тертилей
(то есть, квантили 0.33 и 0.67) с “точечным” методом, в котором оцениваю
щ его просят дать модальное значение неопределенной величины , а затем
два значения, одно выш е и одно ниж е моды, каж дое из которых может про
изойти такж е вероятно, к ак и модальное значение (то есть, точки, для кото
ры х ф ункция плотности вероятности является наполовину настолько ж е
вы сока, как и в моде). П ри использовании 10 вопросов к ак неопределенных
величин и 70 студентов Ф акультета внеш ней разведки в межгрупповом про
екте, для метода тертилей они обнаруж или, что 29% (а не 33% ) истинных
ответов попадают в центральны й интервал. Д ля точечного метода, только
39% попадаю т между двумя равновероятными точками, принимая во вни
мание, что, для больш инства распределений, приблизительно 75% плотно
сти попадает между этими точками.
П итц (P itz , 1974) сообщил о нескольких результатах, использую щ их ме
тод тертилей. Д ля 19 испытуемых, экспертов населения 23 стран, он обна
руж ил только 16% истинны х значений, попадающ их в центральную треть
распределений. В другом эксперименте он изменил вопросы согласно глу
бине и богатству знаний, которыми, по его предположению, обладали ис
пытуемые. Д ля населения стран (низкое знание) он обнаружил 23% истин
ны х значений в центральной трети; для высот известных зданий (посред
ственное знание) 27% ; а для возрастов известных людей (высокое знание)
47% , причем последнее означение было намного больше ож идаемы х 33% .
В другом исследовании, он попросил 6 испытуемых оценить тертили и не
скольким и днями позж е, сделать выбор среди ставок, основанных на их соб
ственны х значениях тертилей. Он обнаружил сильное предпочтение став
кам , из центральной области, к ак раз противоположное к чему должно было
привести плотное расположение интервалов.
Испытуемые Ларсона и Ринана (Larson и Reenan, 1979) сначала угадывали
истинный ответ (то есть, моду) и затем еще два значения, которые определяли
интервал, в пределах которого, они были “вполне уверены”, находился пра
Калибровка вероятностей... 377
вильный ответ. Сорок два процента истинных значений, леж али вне этой обла
сти. Обратите внимание, насколько похож этот индекс неожиданности на ин
дексы испытуемых Альперта и Рейффы, которым дали вербальные формули
ровки “минимум / максимум” (47% ) и “удивительно высоко / низко” (38%).
О б суж д ен и е
Барух Фишхофф
В п о и с к а х м уд рости
Х отя прошлое никогда точно не повторяется, в нем часто можно обнаружить
повторяю щ иеся элементы. Люди принимаю т одинаковые реш ения, реш а
ют одинаковые задачи и терпят одинаковые неудачи достаточно часто, что
бы ученые-бихевиористы могли полагать, что они могут обнаружить повто
ряю щ иеся образцы поведения. Такое убеждение заставляет психометрис-
тов изучать диагностические тайны клинических психологов-асов, клини-
цистов-и скать корелляты ненормального поведения, брокеров — замечать
признаки роста цен, а диктаторов — обдумывать революционные ситуации.
И х поиск обычно имеет логику, параллельную логике многократного рег
ресса или корреляции. Собран набор соответствующих случаев, и каж ды й
член характеризован с помощью разнообразных измерений. В получивш ей
ся матрице ищ ут существенные связи, которые могли бы помогать нам в
прогнозировании будущ его....
Формальное моделирование
Ежедневный бланк бегов (Daily Racing), например, предлагает серьезному
игроку приблизительно 100 отрезков информации относительно каж дой
лош ади в любом забеге. И грок, склонны й к обработке данны х, мог бы ввес
ти в пам ять компью тера содержание одного издания и пробовать получить
формулу, предсказываю щ ую скорость к ак оцененную сумму множ ества в
различны х измерениях. Например:
В чем же проблема?
Существуют другие контексты , в которы х ош ибки в малом могут вы гля
деть другими, когда рассматривается более ш ирокий контекст. Н апример,
нас учат, что научные теории долж ны опровергаться, если представлено
некое противоречащ ее им доказательство. В результате, мы быстро осуж
даем учены х, которые упорствуют в своих теориях, несмотря на то, что их
неправильность бы ла доказана. Кун (K uhn, 1962), однако, утверж дает, что
такая локальная недальновидность мож ет быть совместимой с более гло
б ал ьн о й м удростью в п о и ск е н ауч н ого зн ан и я . Д руги е (н ап р и м ер ,
Feyerabend, 1975; L akatos, 1970), ф актически, превознесли роль дисципли
нированной анархии в росте понимания и сомневались относительно воз
можности появления мудрости из организованной приверженности к лю
бому одобренному методу исследования. Они доказываю т, что неж елание
принимать во внимание противоречащ ие данные или отказаться от очевид
но опровергнутых теорий часто необходимо для научного прогресса.
Ш траф в 125 миллионов долларов, налож енны й на автомобильную Ком
панию “Ф орд” в случае с моделью “Пинто” (P into), сделал реш ение компа
нии сэкономить несколько долларов на дизайне топливного бака автомоби
л я очень недальновидным. Все ж е в чисто экономических терминах, гаран
тируемая экономия, скаж ем , 15 долларов на каж дом из 10 миллионов “П ин
то” делает риск нескольких больших исков похожим на более разумную азар
тную игру. Так к ак в приговоре в этом хорошо освещенном в средствах мас
совой информации иске сумма была уменьш ена до 6 миллионов долларов
после аппеляции, ком пания ф актически вы гадала в строгих экономичес
ки х терминах, несмотря на то, что ситуация ухудш илась. В чем был промах
ком пании, так это в рассмотрении одного контекста (количество автомоби
лей, на которы х можно было сэкономить деньги), а не другого (неэкономи
ческие последствия ее реш ения). К омпания, видимо, не поняла влияния,
которое неблагоприятное общественное мнение оказало бы на образ “Фор
да” к ак производителя автомобилей, заботящ егося о надежности, или на
цены за используемый “П инто” (хотя эту цену “П инто” платил владелец, а
не производитель).
Если осуждение - это название игры , ош ибка - это ош ибка. Все ж е, если
вы заинтересованы в получении знаний из опыта других, важ но определить
то, какую проблему вы пы тались реш ить. После осторожной проверки, мно-
Обреченным необходимо изучать прошлое... 389
гае очевидные ош ибки, оказы вается, представляю т свежее решение непра
вильной проблемы. Например, если это может критиковаться вообще, ком
пания Форд могла бы быть объявлена виновной в тактической мудрости и
стратегической недальновидности (или возможно в предпочтении здоровья
социальному благосостоянию).
Это различие важно не только для оценки прошлого, но такж е и для знания,
какие корректирующие меры должны быть приняты в будущем. Обычно, так
тические ошибки легче исправить, чем стратегические недоразумения. Как
только мы должным образом охарактеризовали ситуацию, мы можем завести
“книгу”, в которую будем записывать обычную мудрость как накопленную с
эмпирическим опытом, или, по крайней мере, формулы для оптимального объе
динения информации, имеющейся в нашем распоряжении (H exter, 1971). Ме
неджеры в бейсболе либо знают, что лучше заменить отбивающего бегуном на
первой игре и не заменять в игре на равных, либо применят статистику, чтобы
вычислить, как “получить проценты”. Эти руководящие принципы, однако,
бесполезны или вводят в заблуждение, если реальная проблема, которая долж
на быть решена - это утверждение морали (бегун имеет шанс вести лигу на за
няты х базах) или помощь билетной кассе (болельщики должны видеть некото
рую интригу). Исследования неожиданных нападений в международных от
ношениях показывают, что нации, которых заставали врасплох, часто хорошо
играли по своей книге, но неправильно определяли поле, на котором они игра
ли (BenZvi, 1976; Lanir, 1978). В некотором смысле, они читали неправильную
книгу; чем лучше они читали, тем быстрее они проигрывали.
Одна причина для трудности, поставленной стратегическими проблемами -
то, что их нужно “продумывать” аналитически, не используя преимуществ со
вокупного (статистического) опыта. Второе ограничение - это то, что неправиль
ные представления часто широко разделяются в пределах принимающей ре
ш ения группы или сообщества. С человеком консультируются относительно
решения только после того, как он закончил отвечать на вопросы в книге. Реко
мендуемые советы для учреждений, заинтересованных в избегании неожидан
ностей : (а) основывайте несколько отдельных аналитических групп, чтобы обес
печить многократные, независимые взгляды на проблему, или (Ь) назначьте
человека, который служил бы “адвокатом дьявола” для непопулярных точек
зрения (Janis, 1972). Практически, первая стратегия может потерпеть неуда
чу, потому что распространенные неправильные представления делают груп
пы очень похожими друг на друга, создавая скорее избыточность, чем плюра
лизм (Chan, 1979). Второй пункт терпит неудачу, потому что адвокаты либо
склоняю тся под давлением группы, либо подвергаются гонениям, если они
принимают свои непопулярные позиции всерьез, даже, когда эти “крайние”
позиции радикально не противоречат мнениям группы.
Неспособность отличить тактические решения от стратегических могут так
ж е создать неоправданную иллюзию мудрости. Банки и страховые компании
обычно считаются чрезвычайно рациональными и ловкими в процессах при
нятия решений. Все ж е более пристальное рассмотрение показывает, что эта
390 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
репутация происходит из их успеха в создании часто повторяющихся, такти
ческих решений, в которых они почти не могут проигрывать. Ссуды под залог
недвижимости и страхование ж изни рассматриваются на основе консерватив
ны х интерпретаций статистических таблиц, приобретенных и отрегулирован
ны х с помощью массивного опыта проб и ошибок. Попытки этих учреждений
принимать спекулятивные решения, требующие аналитических, стратегичес
ких решений, говорят о том, что они - не умнее, чем все мы. Коммерческие
банки потеряли большие суммы денег в 60-ых, благодаря необдуманным инве
стициям в тресты недвижимости; подобный небольшой процент их всех реше
ний в 70-ых приковал экономику США к будущему полукредитоспособных
стран Третьего мира, которым были сделаны большие займы (более $ 60 мил
лиардов). (Хотя эта связь может быть оправдана пользой для всего человече
ства, которая вовсе не была проблемой, которую решали банки.) Медленный и
беспорядочный ответ страховых компаний на изменения в экономике страхо
вания несчастных случаев; и их почти случайные, неаналитические методы
для многих необычных рисков должны заставить нас почувствовать себя не
такими недальновидными по сравнению с этими превозносимыми учрежде
ниями.
2Один из моих любимых контрастов - это, когда рыночные цены повышаются после хоро
ших экономических новостей, то это считается ответом на новости; если же они падают, это
объясняется, тем, что хорошие новости уже были обесценены.
Обреченным необходимо изучать прошлое... 395
конечно, сокращение, неспособность полученного правила работать на новой
выборке событий. Частота и сила методологических предупреждений против
чрезмерной совместимости предполагают, что корреляционное применение
избыточной мощности - это предубеждение, которое является весьма стойким
даже к расширенному профессиональному обучению (для ссылок, см. Fischhoff
и Slovic, 1980).
Теория чрезмерной совместимости подобна костюму, скроенному точно для
одного человека в одной специфической позе, который не подойдет кому-либо
еще или даже, тому же самому человеку в будущем или даже в настоящем,
если у него происходит некоторое заметное изменение (например, если он
делает выдох, чтобы показать живот). Историк, который построил гермети-
L
Уровень накопления
3Мой друг однажды проходил курс по чтению форм диаграмм в сфере маклерства. Каждое
занятие включало обучение 10-12 новым признакам. Когда курс закончился, через пять
занятий и 57 признаков, у преподавателя осталось еще много в запасе.
Обреченным необходимо изучать прошлое... 397
значимое? Конечно, способ проверить эти объяснения или теории - испы та
ние с новыми выборками. Этот ш аг, к сожалению , редко предпринимается
и часто не возможен по техническим или этическим причинам (Tukey, 1977).
Связанные ослож нения могут возникать даж е с установленными теори
ями и наборами данных. Диаконис (D iaconis, 1978, с. 132) отмечает труд
ность оценки количества неожиданностей в результатах экстрасенсорного
восприятия, даж е в редких случаях, в которы х они были получены в конт
ролируемой обстановке, потому что определения нужного события продол
ж аю т изм еняться. “Главный клю ч к успеху Б.Д . было то, что он не опреде
лял заранее результат, который нуж но рассматривать к ак неожиданный.
Разногласия против некоторого совпадения существенно меньш е, чем про
тив любого заранее определенного совпадения”.4
Туфт и Сан (T ufte и Sun, 1975) обнаруж или, что существование или от
сутствие пределов зависит от творческого потенциала и гибкости, допуска
емой в определении события (для какого офиса? на каки х выборах? насколь
ко хорошо? пределы, которые отсутствуют, должны быть вклю чены?). Они,
как полагаю т, существуют, потому что мы имеем удивительную способность
обнаружить сигнал даж е в полном ш уме.
4Диаконис продолжает, “Чтобы далее усложнить любой анализ, несколько таких неточно
определенных экспериментов часто проводились одновременно, взаимодействуя друг с дру
гом. Молодой исполнитель держал аудиторию в напряжении. Его часто полностью невер
ные предположения вообще расценивались скорее с симпатией, чем сомнением; и для боль
шинства наблюдателей они, казалось, только подтверждали наличие сверхъестественных
способностей у Б.Д.”
398 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
наряду с любым сметением, который автор, возможно, чувствовал (Gallie, 1964;
N ow ell-Sm ith, 1970). Только одна из тайн этого явлен и я раскры та Тауни
(Tawney, 1961); “Историки приписывают появление неизбежности существу
ющему порядку, выдвигая на первый план силы, которые одержали победу и
отодвигая на задний план те, которые они проглотили”(с. 177).5
Х отя это и интуитивно привлекательная цель, построение последователь
ны х рассказов подвергает читателя некоторым интересным предубеждени
ям . Законченны й рассказ состоит из ряда независимы х звеньев, каж дое
довольно хорошо определено. П равда рассказа зависит от правды звеньев.
Вообще, чем большее количество звеньев появляется, и большее количество
деталей находится в каж дом звене, тем менее вероятно, что история долж
на быть правильной в ее полноте. Однако Словик, Ф ишхофф и Л ихтенш
тейн (Slovic, Fischhoff и L ichtenstein, 1976)наш ли,что добавление д етали к
описанию события может увеличивать его каж ущ ую ся вероятность возник
новения, очевидно, увеличив его тематическое единство. Бар-Х иллел (Ваг-
H illel, 1973) обнаруж ила, что люди последовательно преувеличиваю т веро
ятность конъю нкции ряда вероятны х событий. Н апример, ее испытуемые
вообще предпочитали ситуацию , в которой они получат приз, если семь не
зависимы х событий, каж дое с вероятностью 0.90 долж ны произойти, ситу
ации, в которой они получат тот ж е самый приз, если при подбрасывании
монеты вы пал “орел”. Вероятность сложного события меньш е чем 0.50, при
ним ая во внимание, что вероятность единственного события - 0.50. Други
ми словами, неопределенность, каж ется, нарастает в медленном темпе.
Что случается, если последовательность вклю чает одно или несколько
слабы х или маловероятны х звеньев? Вероятность его самого слабого звена
долж на установить верхний предел вероятности полного рассказа. После
довательные суж дения, однако, могут быть компенсационными, с последо
вательностью сильны х звеньев “выравниваю щ их” бессвязность слабых свя
зей. Этот эффект используется адвокатами, которые помещают самое сла
бое звено в их аргументах рядом с началом их выводов и заканчиваю т пото
ком убедительных, неоспоримых аргументов.
Коулс (Coles, 1973) предоставил восхитительный пример полной последо
вательности истории, скрывающей неправдоподобность ее звеньев: наиболее
серьезная попы тка Ф рейда в психоистории была составить биографию Лео
нардо да Винчи. В течение многих лет, Фрейд искал тайну, позволяющую
понять Леонардо, чье детство и юность были в основном неизвестны. Н ако
нец, он обнаружил ссылку Леонардо на воспоминание о стервятнике, касаю
щ емся его губ, в то время к ак он был в колыбели. Отмечая идентичность еги
петских иероглифов для “стервятника” и “матери” и другого свидетельства,
Ф рейд продолжал строить внуш ительный и последовательный анализ Лео
5Такие стратегии могут затрагивать дух, также как и разум, субъективно увеличивая силу
и стабильность статуса-кво и сокращая его очевидную способность к изменению (Markovic,
1970).
Обреченным необходимо изучать прошлое... 399
нардо. При составлении окончательного издания работ Фрейда, однако, ре
дактор обнаружил, что немецкий перевод воспоминания Леонардо (первона
чально по-итальянски) который использовал Фрейд, был ошибочным, и что
это был бумажный змей, а не стервятник, который гладил его губы. Несмот
ря на наличие клю ча к разрушению анализа Ф рейда, редакторы реш или, что
остающийся каркас был достаточно прочен, чтобы выстоять это. К ак Хек-
стер заметил (H exter, 1971, с. 59), “Частично, потому что написать плохую
историю довольно легко, хорошие истории пиш утся очень редко”.
Заклю чен и е
К акие общие уроки мы можем извлечь из изучения прошлого, за исклю че
нием ф акта, что понимание является более неуловимым, чем это может быть
часто подтверждено?
П едант ичност ь
В дополнение к неизбежному заклю чению в рам ках наш его времени, мы
часто ещ е больше ограничиваем наш у перспективу, добровольно надевая
ш оры, которые сопровождают строгую приверженность единственному н а
учному методу. Д аж е когда он используется рассудительно, ни один метод
400 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
не является адекватным для ответа на многие вопросы, которые мы задаем
прош лому. Каждый сообщает нам что-либо и несколько вводит в заблуж де
ние. Когда мы не знаем, к ак получить правильны й ответ на вопрос, необхо
дим а альтернатива эпистемологии: используйте по возможности ш ирокий
диапазон методов или перспектив, каж ды й из которых позволяет вам избе
ж ать некоторых видов ош ибок. Это означает своего рода меж дисциплинар
ное сотрудничество и отношение, отличное от того, с которым люди сталки
ваю тся в большинстве попыток смеш ать два подхода. Совпадения или не
совпадения, подобно психоистории, слиш ком часто предпринимаю тся за
щ и тн и кам и, нечувствительны м и к ловуш кам в их приняты х областях
(F ischhoff, в печати - Ь). Х екстер (H exter, 1971, с. 110) описывает истори
ков, вовлеченных в некоторые такие приклю чения к ак “кры сы , прыгаю
щ ие с борта интеллектуально тонущего корабля” .
Обсуждение
Возвращ аясь к Бенсону (Benson, 1972), если мы хотим, чтобы прошлое слу
ж ило будущему, мы не можем обращ аться с ним в изоляции. П равила, кото
ры е мы используем, чтобы объяснить прошлое, должны такж е быть теми,
которые мы используем, чтобы прогнозировать будущее. Мы должны нако
пить опыт, обращ ая внимание на все уместные испытания наш их гипотез.
Один аспект выполнения этого компилирует отчеты, которые могут быть под
вергнуты систематическому статистическому анализу; второй - хранит след
обсуждения, предшествующего наш им собственным решениям, понимая, что
настоящ ее будет скоро прошлым и что хорошо сохраненное описание являет
ся лучш им средством предотвращ ения предубеждения ретроспективы; тре
тий делает прогнозы, которые могут быть оценены; один тревожащ ий урок
из ядерной катастрофы на острове Три Майлс - то, что не в полне ясно, что
этот якобы диагностический случай показал нам относительно валидности
Исследования атомной безопасности (А мериканская Комиссия по атомному
урегулированию, 1975), которое попыталось оценить угрозы ядерной энер
гии: четвертый аспект получает лучш ую идею относительно валидности н а
ш их собственных чувств достоверности, поскольку уверенность в существу
ющем знании управляет наш ей ж аж дой новой информации и интерпрета
ций (Fischhoff, Slovic и Lichtenstein, 1977). Таким образом, мы должны струк
турировать наш у ж изнь, чтобы облегчить обучение.
Н еопределенност ь
В конце, тем не менее, не может быть н икаких ответов на многие из вопро
сов, которы е мы излагаем. Н екоторые плохо сформулированы. Н а другие
н ельзя ответить с помощью сущ ествую щ их или возможных инструментов.
Столько, сколько мы хотели бы знать “к ак профессионалы делают это”, не
сущ ествует статистического способа смоделировать образ суж дения экспер
Обреченным необходимо изучать прошлое... 401
тов до желательной степени точности с реальными стимулами. Наши теории
часто “настолько сложные, что никакая отдельная количественная работа не
могла даже начать проверять их валидность” (O’Leary и другие, 1974, с. 228).
Когда группы, которые мы хотим сравнить по одной переменной, такж е от
личаю тся по другой, не существует логической процедуры для приравнива
ния их на этой мешающей переменной (МееЫ, 1970). Когда мы попробовали
применить много возможных объяснений к одному набору данных, не суще
ствует твердого способа узнать, сколько степеней свободы мы использовали,
и как мы капитализировали случайности (Champbell, 1975). Когда мы исполь
зуем множественные подходы, знание, которое они производят, никогда точ
но не конвергирует. В конце концов, можно попытаться применить философ
скую перспективу Тревельяна, что “несколько несовершенных подходов к
истории - это лучш е, чем ни одного” (по М арвик, 1970, стр. 57).
Часть VII
Многоступенчатая оценка
24. Оценка составных вероятностей в
последовательном выборе*
*Эта глава первоначально появилась в Nature, 1971, 32, 414-416. Авторское право ® 1971
Macmillan Journals, Ltd. Переиздано в соответствии с разрешением.
406 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
вероятностью , n'm, расположения цели. Наш эксперимент предназначен для
проверки этого прогноза и объяснения явлений, которые возникнут в ситу
ации.
Ц) j р = g (0 .8 6 rnlogen -0 .7 2 ) (2 )
р=пт (3)
Вард Эдвардс
p (d I h ^ pcha)
Р (H a |D )=
( 1)
P(D )
2г-п
-2 0 2 4 6 В 10 12 14 16 18
s —f
Qj=Lc • Q0
418 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
Константа С, степень, в которую каж дое отношение вероятности возводит
ся до обработки ее посредством теоремы Байеса, составляет отношением точ
ности. К сож алению , она зависит от важ ны х независимы х переменны х,
вклю чая диагностичность данных и ответную метрику. Однако, то, что та
к а я простая н аглядная модель так хорошо вписы вается, можно объяснить
в соответствии с любой теорией консерватизм а....
... Вероятностная система обработки информации, или ВСОИ ( или с англ.
PIP)... - это идея о том, как проектировать человеко-маш инные системы,
которые долж ны обрабатывать информацию для достиж ения заклю чения
о том, в каком состоянии находится мир. Примеры ситуаций, в которые та
к а я обработка информации долж на быть сделана, вклю чаю т медицинский
диагноз, военное командование (в котором командую щ ий, возможно, дол
ж ен определить, действительно ли он находится под угрозой нападения, и
если так, каков план его противника), и управление бизнесом (например, в
случае бизнесмена, решающего, необходимо ли производить новое изделие).
И дея относительно ВСОИ слиш ком слож ная, чтобы объяснять ее подробно
здесь (см. Edw ards, Lindm an и P hillips 1965, или W . Edw ards, 1966). Сущ
ность ВСОИ в том, что задача диагностической обработки информации мо
ж ет быть разделена на два класса подзадач. Один класс подзадач состоит из
оценки диагностического воздействия индивидуальной данной величины
на отдельную гипотезу или пару гипотез. Д ля вербальных, качественных
видов данны х и для гипотез, которые характеризую т многие реальные ди
агностические установки, это, каж ется, задача, которая обязательно долж
на вы полняться человеком с большим опытом. Но второй класс подзадач -
это соединение этих отдельных диагностических воздействий для всех дан
ны х и гипотез в картину того, к ак все гипотезы в настоящ ее время пред
ставлены в свете всех доступных данных. Эта задача соединения может быть
легко механизирована посредством теоремы Байеса, если диагностические
воздействия индивидуальных данных оценены в форме значений Р (D\H)
или отнош ения вероятности. (В большинстве ситуаций, хотя не во всех, оцен
ки отнош ений вероятности явно предпочтительны, по формальным причи
нам , для оценки Р (D\H).)
Мне и приблизительно пятнадцати сотрудникам было интересно, рабо
тает ВСОИ или н е т . Мы разработали придуманный, но сложный мир 1975.
В этом мире мы перечислили ш есть гипотез, которые тестируемые должны
были рассмотреть, определяющ ие три источника данны х (Система дальне
го обнаруж ения баллистических ракет, система спутникового зондирова
н ия и система разведки), которые обеспечивали данные, опираю щ иеся на
эти гипотезы , и разработали четыре системы для обработки данны х. Эти
четы ре системы назы вали P IP , POP, PEP и PU P. В P IP , тестируемые оцени
вали п ять отношений вероятности для данной переменной. Одна из этих ш е
сти гипотез была “Будет продолж аться мир”, а другие пять были вероятно
стью различны х войн; пять конъю нкций войны с миром определяли пять
отнош ений вероятности, которые будут оценены. Другие три системы обра
Консерватизм в процессе обработки... 419
ботки информации, которые Есе подразумевали, что испытуемый оценивал
апостериорные ш ансы или вероятности или подобные апостериорные вели
чины ; таким образом, в P IP компьютер соединил данные посредством тео
ремы Байеса, в то время к ак во всех трех других сис темах испытуемые дол-
ясны были объединить данные в уме. Чтобы помочь им это сделать, тестиру
емые в POP, PEP и PU P производили оценивание, после того, к ак им стано
вилась доступна n -ная данная величина, когда они рассматривали (п+1)
данную величину, так что им приходилось только модифицировать оцен
к и , на которые повлияли данные величины.
Количество испытаний
М етод
Ц ель эксперимента требовала, по крайней мере, трех уровней переменных,
построенных таким образом, что промежуточный уровень переменной со
держ ит более двух событий. Далее требуется управление распределением
вероятности для всех событий, кроме наиболее вероятного из промежуточ
ны х - управление, которое будет иметь результирующ ее воздействие на ве
личину пересмотра оптимальной вероятности на верхнем уровне как резуль
тат возникновения события на более низком уровне.
Следовательно, три уровня приняли следующую форму. Переменная верх
него уровня состояла из двух меш очков, помеченных I и II, соответственно.
К аж ды й меш очек был заполнен маленькими контейнерами, которые пред
ставляли собой события промежуточного уровня. К примеру, каж ды й ме
ш очек содерж ал 18 м аленьких коробочек (коробочки от 35-милиметровой
пленки) и каж дая из них была помечена А, В, С или D. Н аконец, в каж дой
Гипотеза угадывания в многоступенчатом выводе 425
коробочке было 100 маленьких цветны х картонны х круж очков; каж ды й
из которы х был одного из четы рех цветов: красны й, ж елты й, зелены й, си
ний.
Состав каж дого контейнера описан в Таблице 1. Часть А таблицы описы
вает состав меш очка относительно коробочек, и Часть В - относительно кру
ж очков. Н апример, 8 коробочек, помеченных А , находятся в меш очке I,
тогда к ак только I коробочка, помеченная А, находится в меш очке II. К ак
показано в части В, 80 круж очков находятся в коробочке А, 1 - в коробочке
В, 1 - в коробочке С и 18 - в коробочке D.
П л а н эксперимент а
Бы ли разработаны три задачи по типу представленных в Таблице 1. Часто
ты , показанны е в части А, использовались во всех трех задачах. М атрица,
показанная в части В, использовалась в одной задаче; в других двух задачах
значение 80 в более низкой матрице было изменено или на 70, или 90, а зна
чение 18 было изменено или на 28, или на 8, соответственно. Д ля последую
щ его обсуждения эти три задачи будут определяться к ак задачи 70-28, 80-
18,90-8. Во всех трех задачах испытуемые оценили ш ансы меш очков, учи
ты вая цвет одного круж очка, взятого из коробочки.
И н ст р укц и и испытуемым
И нструкции были кратким и из-за предыдущего эксперимента. Испытуе
мым объяснили детали задачи. Их попросили представить, что мешочек был
выбран наугад на основании подбрасывания монеты, что коробочка была
наугад вы брана из меш очка, и что картонны й круж очек был наугад выбран
из коробочки. И х попросили предположить, что круж очек определенного
цвета был выбран таким образом и оценить ш ансы мешочков на основании
цвета этого круж очка.
Процедура
П олучив инструкции, испытуемые оценили ш ансы мешочков в трех зада
чах. М атрицы, подобные указанны м в Таблице 1, использовались, чтобы
показать испытуемым относительные частоты коробочек и круж очков. За
дачи были представлены в случайном порядке для каж дой группы, состоя
щ ей от 4 до б человек. В каж дой задаче четыре возможных цвета использо
вались в случайном порядке. Испытуемые оценивали ш ансы меш очков для
всех возмож ны х цветов перед тем, к а к приступить к следующей задаче.
После 12 оценок (4 цвета в задаче х З задачи) три задачи были повторены,
используя другие случайные порядки для всех 24 оценок, по две для к аж
дого цвета в каж дой задаче.
Р е з у л ь т а т ы и об суж д ен и е
Обзор данны х показал чрезвычайную бимодальность в оценках шансов. Д ля
некоторы х испытуемых теоретическое различие между синими и красны
ми круж очкам и и между зелеными и ж елты ми круж очками не вы зывало
различия в оценках шансов. Другие испытуемые были более крайними в
оценках ш ансов с синим круж очком, неж ели с красны м и более крайним и с
ж елты м круж очком , неж ели с зеленым. Последние соответствовали МТБ,
по крайней мере, в порядковом смысле. О казалось, что некоторые испытуе
мые "не знали" о разнице синий-красны й и ж елты й-зелены й, в то время,
к ак другие испытуемые "знали" в той степени, что они отвечали, по край
ней мере, в правильном отнош ении. П ринимая это во внимание, все испы
428 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
туемые, которы е отвечали, по крайней мере, с одной оценкой шансов для
синего, которая была на 2 % больше, чем зеленого или оценка для желтого, на
2% выш е, чем зеленого, были названы "знаю щ ими". Эти испытуемые были,
по крайней мере, минимально "знаю щ ими", т.к . для одного или нескольких
оцениваний их оценки шансов изменялись в паре синий-красный и паре ж ел
тый-зеленый в направлении, которое определяла МТБ. 10 из 25 испытуемых
были названы "знающ ими" с помощью этого консервативного критерия.
Остальные 15 "незнаю щ их" испытуемых, были не склонны отвечать по-
разному на изменение в вероятностях менее вероятных событий. Они бук
вально игнорировали выводы менее вероятных коробок. И х ответы соответ
ствуют крайней форме модели "угады вания". М едианы ответов "незнаю
щ их" испытуемых показаны на рис.1. П оскольку меш очек, по которому
ш ансы предпочтительны иррелевантны , данные нанесены на ш калу абсо
лютного логариф ма ш ансов. Средние ответы логарифма шансов на красны е
и синие круж очки соединены сплош ной линией в верхней части рисунка
для трех уровней неопределенности данны х, медианы для ж елты х и зеле
ны х круж очков такж е помечены в ниж ней части рисунка. Н а рис. 1 такж е
обозначены прогнозы для МТБ (линия на диагонали), предсказания для мо
дели "к ак будто" (две горизонтальные линии) и предсказания для версии
модели угады вания, обозначенной на рисунке к ак модель I.
П редсказания модели I получены путем умнож ения вероятности наибо
лее вероятного события на апостериорные ш ансы, полученные, если собы
тие было верным. Предположим, в задаче 80-18 был выбран красны й кру
ж очек. Вероятность коробочки А - 0.80, ш ансы 8:1, если действительно
круж очек вы нимался из А. П редсказания модели I будут 0 .8 8 /1 = 6 .4 или
ш ансы 6.4:1. Модель "как будто" прогнозирует шансы 8:1 для синих и крас
ны х круж очков и 6:3 для ж елты х и зелены х, при условии, что пороговая
уверенность в типе коробочки преодолена. Д ля МТБ оптимальные ш ансы
для красного круж очка - 2.86:1 и могут быть вычислены в соответствии со
следующ ей формулой для апостериорных шансов (изменено из формулы 5
в G ettys & W illke, 1969):
Шансы абсолютного
логарифма МТБ
Яков Троуп
М одель Б а й е с а д л я в ы в о д о в и з за п о м н е н н о го п о в ед ен и я
В настоящ ем исследовании испытуемые оценивали вероятности того, что
некоторые субъекты обладают определенными признакам и, на основе соб
ственной ненадежной выборки поведения субъектов. Чтобы проверить ги
потезу, что эти субъективные вероятности будут несправедливо высокими
и недостаточно чувствительными к надежности, их сравнили с оптималь
ными вероятностями. Последние были получены из модели Байеса, кото
рая бы ла разработана исследователями многоступенчатого вывода вероят-
ности(см. P eterson, 1973). Н ачинаясь с одноступенчатого вывода от действи
тельного поведения В. до характеристик личности А., теорема Байеса при
нимает следующую привычную форму
*Данные впервые появились в The Journal of Personality and Social Psychology, 1978, 36,
93-106. Авторское право © 1978 принадлежит Американской психологической ассоциации.
Перепечатано в соответствии с разрешением.
432 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
дого акта поведения, который может выбрать актор. Наблюдатели не зна
ют, какой акт поведения был выбран в действительности. Они могут только
вывести вероятности поведения из того, что они действительно помнят, В*.
У читы вая это заклю чение, теорема Байеса принимает вид
P ß i / B * ) = ^ lP ( A i / B j) P ( ß jl В*) (3)
j
Э к сп ер и м ен т 1
М ет од
Введение. Сначала испытуемым предложили оценки студентов на старш ем
курсе. Позднее им приш лось вспоминать оценки и оценивать вероятность
того, что каж ды й студент был зачислен в аспирантуру ш колы бизнес-уп
равления. Эта задача подразумевает 2 логических ш ага: (а) от вспомненной
оценки (G*) к реальной оценке студента (G); (Ь) от реальной оценки к тому,
был ли студент зачислен или нет в аспирантуру (А). Неопределенностью
последнего ш ага управляли посредством изменения диагностического зна
чения оценок, принимая во внимание зачисление в ш колу бизнес-управле
ния. Оценки низкой диагностичности были выпускными оценками по пред
мету «Введение в антропологию », а оценки высокой диагностичности были
выпускны ми оценками по предмету «Введение в экономику». Надежность
воспоминаний управлялась за счет изменения числа студентов, чьи оценки
необходимо было вспомнить.
Процедура. Испытуемым сказали, что в определенный год было принято
50% претендентов на поступление в ш колу бизнес-управления. Таким об
разом, априорная вероятность быть приняты м и не быть приняты м , Р(Ау) и
Р(Ап) бы ла 0.50. Испытуемым сказали, что они будут оценивать вероятность
зачисления для студентов, выбранных наугад. Им такж е сообщ или, что
оценки будут основаны на том, были ли оценки студента в данном предмете
ниж е 75 (Gj) или выш е 75 (Gh) по ш кале от 0 до 100.
Манипуляции с диагностическим значением. Два распределения веро
ятностей (каж дое представлено в виде столбчатой диаграммы) соотнесли
оценки и зачисление. Одна диаграмма показы вала доли зачисленны х сту
дентов, которы е получили Gj или Gh. Эти доли представляли условные ве
роятности P(G j/A y) и P(Gh/A y). Д ругая диаграмма показы вала пропорцию
не зачисленны х студентов, которые получили эти оценки, то есть P(G j/A n)
и P(Gh/A n). Д иаграмма для оценок высокой диагностичности (курс по эко
номике) показы вала следующие доли: P(G1/A n) = P(Gh/A y) = 0.85 и P(G1/A y)
= P(Gh/A n) = 0.15. Диаграмма для оценок низкой диагностичности (курс по
антропологии) показы вала следующие доли: P(G1/A n) = P(Gh/A y) = 0.55 и
P(G j/A y) = P(Gh/A n) = 0.45. Каждый испытуемый оценивал две выборки сту
дентов, для одной были предложены оценки высокой диагностичности, а
для другой — оценки низкой диагностичности. П орядок представления был
сбалансирован среди испытуемых.
Манипуляции с достоверностью. Обширное предварительное испытание
показало, что определенный уровень достоверности может быть получен,
434 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
за счет изменения количества студентов, чьи оценки необходимо вспомнить.
Испытуемым сообщили, что половина выборки получила низкие оценки, а
другая половина - высокие, и что им предложат список студентов, полу
чивш их высокие оценки. Д ля того чтобы сделать минимальным различие
между пунктами этого списка стимула, студенты были обозначены двузнач
ными числами. Ч исла произносились магнитофоном со скоростью одно чис
ло в секунду. Высокий тон означал конец каж дого списка стимула. Двумя
секундами позж е список испы тания представлялся с помощью магнитофо
на. Список испы тания состоял из 8 двузначных чисел, 4 из которых встре
чались в списке стимулов (т.е. числа Gh) и 4 не встречались в списке (т.е.
числа Gj). Четы ре числа Gh в списке испы тания были взяты из полного ряда
серийны х позиций в списке стимула. П орядок чисел Gt и Gh был случайно
определен для каж дого списка испы тания. К аждые 10 секунд проходило
одно испытание. В промеж утках испытуемым было необходимо указать,
является ли оценка студента G1или Gh и оценить вероятность того, что сту
дент был зачислен в аспирантуру Р(А у / G*), и вероятность, что он не был
зачислен P(An / G*). Предварительное испытание показало, что 10-секунд
ного промеж утка вполне достаточно, чтобы сделать оценки.
И спользовались три вида списков: из 4, 7 и 14 пунктов. Данные, полу
ченные из предварительного испы тания, показываю т что процент правиль
ны х опознаваний варьировался от 60% в длинном списке (условие низкой
достоверности), 75% в среднем списке (условие средней достоверности) до
90% в коротком списке (условие высокой надежности). Каждый испытуе
мый отвечал на список высокой и низкой диагностичности. Наборы чисел е
этих списках были уравновешены с диагносточностью. Двадцать испытуе
мых были распределены к каж дому из трех условий надежности.
Условие полной достоверности. В этом условии одноступенчатого вывода
группа из 46 испытуемых оценивала вероятность зачисления, исходя из
оценок, которые были точно известны, Р(А у /G ) и P(An /G ). Испытуемым
предлож или буклет с диаграммами (т.е. информацию диагностичности) и
оценки студентов. После ознакомления с оценками студентов, испытуемые
отмечали оценки вероятности. Каждый испытуемый оценивал студентов с
оценками низкой и высокой диагностичности. Д ля половины испытуемых
оценки были низким и, а для другой половины - высокими.
Испытуемые. Всего в эксперименте принимало участие 106 человек (42
м уж чины и 64 ж енщ ины ), проходивш их вводный курс по психологии в
Еврейском университете в Иерусалиме. Участие в эксперименте было час
тичны м выполнением требований курса.
Р езульт ат ы и обсуждение
Доли верно опознанны х низких оценок, P(G*j / G j), и вы соких оценок,
P(G*h/ Gh), служ или мерами достоверности каждого испытуемого. Средние
Заключения о личных характеристиках на основе... 435
величины P(G*, / G,) и P(G*h / Gh) показали ближайш ий случайный уро
вень вы полнения в условиях низкой достоверности (список из 14 пунктов)
(М = 0.54 и 0.60 соответственно), хорошее выполнение в условиях высокой
достоверности (список из 4 пунктов) (М = 0.93 и 0.89, соответственно), и сред
нее вы полнение в условиях средней достоверности (список из 7 пунктов)
(М = 0.73 и 0.77, соответственно). А нализ изменения (Достоверность х Ди-
агностичность) этих долей вы явил высоко значимые эффекты достовернос
ти, F(2,57) = 37.06, р < 0.001, и F(2,57) = 20.17, р < 0.001 на P(G* / G,) и
P(G*h / Gh), соответственно. Другие источники изменений не были значи
мы.
Данные, полученные из условия полной достоверности, ясно показы ва
ют эффект влияния манипуляции с диагностичностью на одноступенчатый
вывод и з оценок, которы е точно известны , до вероятности зачисления,
P(A /G ). Испытуемые вывели более высокие P(An/G ,) и P(Ay/G h) из оценок
высокой диагностичности (М = 0.81 и 0.78, соответственно), чем из оценок
низкой диагностичности (М = 0.57 и 0.55, соответственно), различие было
значимы м, как для P(An/G 1), так и для P(Ay/G h), t(22) = 8.08, р < 0.001 и
t(22) = 8.59, р < 0.001, соответственно.
Теперь обратимся к оптимальной апостериорной вероятности зачисления,
учиты вая вспомненную оценку, P(A/G*). Эти вероятности были определе
ны для каж дого испытуемого, объединив вероятности действительных оце
нок, учиты вая вспомненные оценки, P(G/G*) и вероятность зачисления,
учиты вая действительные оценки, P(A /G ), в соответствии с Уравнением 3.
Значения P(G/G*) были подсчитаны для каж дого испытуемого с помощью
Уравнения 2 из собственной достоверности при вспоминании оценок P(G*/G).
Значения P(A /G ) были средними значениями оценок, полученных в усло
виях полной достоверности. Таким образом, оптимальная апостериорная
вероятность зачисления, учиты вая вспомненные оценки, P(A /G *), основы
валась на субъективном одноступенчатом выводе от действительных оце
нок до вероятности зачисления, и на оптимальном одноступенчатом выводе
(Уравнение 2) от вспомненных оценок к действительным оценкам. П унк
тирны е линии в левой части Рисунке 1 представляю т средние значения
P(An/G *1), оптимальную вероятность того, что студент не был зачислен, учи
ты вая, что его оценка была вспомнена к ак низкая; пунктирные линии в пра
вой части Рисунке 1 представляю т средние значения P(Ay/G *h), оптималь
ную вероятность того, что студент зачислен, учиты вая, что его оценка была
вспомнена к ак вы сокая.1Ясно, что согласно модели Байеса, эти вероятнос
ти возрастут вместе с достоверностью и диагностичностью, и что эффект до
стоверности будет виден при высокой диагностичности, а не при низкой.
Э к сп ер и м ен т 4
М ет од
В этом эксперименте испытуемые оценивали вероятности того, что студен
ты муж ского пола выступают за (Ар) или против (Ап) возвращ ения Западно
го берега (территории, занятой И зраилем в войне 1967года) арабам. Голосо
вание за лейбористскую партию (относительно миролюбивую партию) или
за партию Л икуд (Likud) (достаточно воинственную партию) служило как
инф ормация низкой диагностичности. П редварительный эксперимент по
казал , что короткие волосы и голосование за партию Л икуд (Вп) подразуме
вало отрицательное отношение к возвращ ению Западного берега, а длин
ные волосы и голосование за лейбористов (Вр) являлось показателем поло
ж ительного отнош ения. П редварительный эксперимент такж е показал, что
голосование студентов является более показательны м, чем длина волос.
Задача на вспоминание и другие аспекты проекта и процедуры были таки
ми, как и в Эксперименте 1. 20 испытуемых были распределены по каждому
из трех условий достоверности.
Дополнительная группа, состоящая из 57 испытуемых, была распределена
по условию полной достоверности. При этом условии испытуемые точно знали
длину волос студентов или партию, за которую они голосовали. Каждый испы
туемый оценивал вероятности отношения, исходя из ношения коротких во
лос, длинных волос, голосования за лейбористов и голосования за партию Ли
куд.
В общей сложности в эксперименте 4 приняло участие 117 испытуемых
(51 мужчина и б б женщ ин), которые проходили вводный курс по психологии в
Еврейском университете в Иерусалиме.
Наблюдаемая низкая диагностичность
Наблюдаемая высокая диагностичность
Оптимальная низкая диагностичность
Заключения о личных характеристиках на основе
ти и диагностичности (Эксперимент 4)
439
440 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
Р езульт ат ы и обсуждение
М анипуляция с достоверностью имела сильное влияние на степень верных
узнаваний к ак Вп(т.е. короткие волосы или голосование за партию Л икуд),
та к и В р(т.е. длинные волосы и голосование за лейбористов), F(2,57) = 55.45,
р < 0.001 и F(2,57) = 22.04, р < 0.001, соответственно. Средние значения
Р(Вр*/В р) б ы л и 0 .6 1 ,0 .8 2 и 0 .9 1 . Эффект диагностичности и его взаимодей
ствие с достоверностью были незначимыми.
К ак и ожидалось, значения Р(А /В ), выведенные испытуемыми в услови
ях полной достоверности показываю т, что субъективное диагностическое
значение голосования было больш им, чем длина волос. Таким образом, ве
роятности отнош ений Р(Ап/В п), выведенных из того ф акта, что студенты,
голосовавш ие за партию Л икуд, (М = 0.78) были более крайними, чем те,
которые были выведены из того ф акта, что студенты носили короткие воло
сы (М = 0.52), t(56) = 13.61, р < 0.001. Подобным образом, вероятность от
нош ения Р(А /В р), выведенная из ф акта, что студенты голосовали за лейбо
ристов (М = & 75) была более крайней, чем те, которые были выведены из
ф акта, что студенты носили длинные волосы (V= 0.53), t(56) = 9.89, р < 0.001.
Оптимальные и наблюдаемые вероятности показаны на рис.2. Первые
были получены от каждого испытуемого через Уравнение 3 от значений Р(В/В*)
(рассчитанные через Уравнение 1 от достоверности испытуемого в опреде
лении поведения студентов, Р(В*/В)) и из средних значений Р(А /В ), полу
ченны х в условиях полной достоверности. Можно видеть, что только диаг-
ностичность поведения учитывалась и обеспечивала выводы вероятностей
отношения F(1,57) = 68.94, р < 0.001, и F(1,57)= 90.40, р < 0.001 для Р(Ап/В п*)
и Р(Ар/В р*), соответственно.2 При наруш ении модели Байеса основное вли
яние достоверности и её взаимодействие с диагностичностью были незначи
мы. Кроме того изменения наблюдаемых вероятностей в пределах списков
высокой диагностичности были не больше, чем изменения в пределах спис
ков низкой диагностичности, t(59) =0.59. К ак и в предыдущ их эксперимен
тах, наблюдаемые вероятности были более крайними, чем оптимальные ве
роятности F (l,5 7 ) = 5.68, р < 0.05 и F (l,5 7 ) = 27.63, р < 0.001 для Р(Ап/В п*)
и Р(Ар/Вр*), соответственно. Н аконец, из двенадцати корреляций для ис
пы туемых при условиях между наблюдаемыми и оптимальными вероятно
стям и восемь были положительными, но только две были значимыми: г =
0.436, р < 0.05 для Р(Ап/В п*) при условии высокой диагностичности и высо
2 Необходимо отметить, что эти результаты не могут быть приписаны к тому факту, что
диагностичностью управляли как внутригрупповой переменной, а достоверностью как меж
групповой переменной. Был проведен дисперсионный анализ по выводам первого списка
студентов, чьё поведение обладало низким диагностическим значением для половины ис
пытуемых в каждом условии достоверности и высоким диагностическим значением для
другой половины. В этом анализе диагностичность рассматривалась как межгрупповой
фактор. Эти анализы показали значимое влияние диагностичности и незначимое влияние
достоверности и обоих факторов вместе (диагностичность х достоверность). Дисперсионный
анализ данных предыдущих трёх экспериментов показал похожие результаты.
Заключения о личных характеристиках на основе... 441
кой достоверности и г = 0.402, р < 0.05 для Р(Ар/В р*) при условии низкой
диагностичности и высокой достоверности.
Эксперимент 4 обеспечивает дополнительную поддержку для обобщения
наш их выводов. Он показы вает, что смещ ения, наблюдаемые в предыду
щ их экспериментах, такж е влияю т на выводы о характеристиках личнос
ти за счет вспомненного поведения. Диагностичность действительного по
ведения субъектов являлась единственным фактором, определяющ им вы
воды даж е когда диагностичность долж на основываться на собственных
убеж дениях испытуемых без получения свидетельства извне.
О бщ ее об суж д ен и е
Выводы, которые наш и испытуемые сделали исходя из собственных нена
дёж ны х воспоминаний, систематически наруш али нормативные правила
вывода вероятности. Испытуемые были склонны полагаться на диагностич
ность информации, не принимая во внимание достоверность, не смотря на
тот ф акт, что они знали о недостоверности своих воспоминаний.
Действительно, сравнения между выводами, исходя из верно вспомнен
ной информации (например, выводы исходя из оценок, которые были вспом
нены к ак низкие и которые действительно были низкими) и выводы, исхо
дя из неверно вспомненной информации (например, выводы исходя из оце
нок, которые были вспомнены к ак низкие, но которые в действительности
были высокими), показали незначительные различия во всех четырёх экс
периментах. То есть последние выводы вероятности были не менее крайни
ми, чем первые. Эти результаты соответствуют точки зрения, что люди
склонны уменьш ать сложность задач, используя простые правила эвристи
ки . Недооценивание информации достоверности может отраж ать исполь
зование одной такой эвристики суж дения — эвристики репрезентативнос
ти (K ahnem an & Tversky, 1973, 4). Например, вспоминая партию , за кото
рую голосовал субъект, испытуемые оценивали вероятность того, что он
является сторонником возвращ ения западного берега арабам, по степени, в
которой голосование за такую партию репрезентативно стереотипу субъек
та, поддерживающ его подобное мнение.
Субъект, голосующий за милитаристскую партию, олицетворяет больше
черт этого стереотипа, чем субъект, который носит длинные волосы. (И в пер
вых трёх экспериментах вы сокая оценка по экономике является более репре
зентативной для студентов, зачисленных в ш колу управления бизнесом, чем
вы сокая оценка по антропологии.) Положительное отношение к возвраще
нию территории было выведено с большей уверенностью в первом случае.
Точность воспоминания не влияла на эти вероятности, потому что она не зат
рагивала оцененную репрезентативность вспомненного поведения.
П ринимая это во внимание, достоверность доклада сравнима с соображе
ниям и размера выборки и базовыми значениями. Размер выборки, на кото
рой основывается свидетельство и базовое значение выведенного отноше
442 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
н и я не влияю т на подобие меж ду свидетельством и признаком . П онятие
репрезентативности предполагает, и исследование показало, что люди не об
ращают внимания на эти соображения, делая выводы (N isbett & Borgida, 1975,
Tversky & K ahnem an, 1974,1). На основании этого можно ожидать, что дос
товерность будет приниматься во внимание в тех случаях, когда она влияет
на репрезентативность доклада. Таким образом, неверное воспоминание ре
альны х поведенческих особенностей (благодаря таким факторам, как проме
ж уток времени, с которого особенность была зарегистрирована), которые де
тализированы больше, чем простые бинарные события, включённые в насто
ящ ее исследование, вероятно, будет влиять на ясность, полноту и яркость
вспоминаемой информации. Т акая неясная информация может быть менее
репрезентативна рассматриваемому признаку, и соответственно, производит
более регрессивные и более умеренные оценки вероятности...
З а к л ю ч ен и я о ли чн ы х хар а к тер и сти к ах на осн о в е... 443
Часть VIII
Коррективные процедуры
28. Устойчивая привлекательность ошибочных
линейных моделей при принятии решений*
Р оби н М . Д а у э с
1 Этот индекс основывался на оценке избирательности Cass & Birnbaum (1968), в их книге
«Сравнительное руководство к американским колледжам» (Comparative Guide to American
Colleges). Этим устным категориям избирательности приписали численные значения, в со
ответствии со следующим правилом: наиболее избирательные - 6, сильно избирательные -
5, очень избирательные(+) - 4, очень избирательные - 3, избирательные - 2, не упомянутые
- 1.
2 К сожалению, только 23 из 111 студентов можно использовать в этом сравнении, потому
что оценочная шкала, используемая комиссией, слегка изменялась от одного года к друго
му.
Устойчивая привлекательность ошибочных ... 449
Л ож н ая л и н ей н ая модель — эта та, в которой веса вы браны неким
неоптимальным методом. Они могут быть выбраны с условием равенства,
они могут быть выбраны, основываясь на интуиции человека, делающего
прогноз, или они могут быть выбраны случайным образом. Тем не менее,
ложные модели могут быть очень полезными. Когда, например, стандарти
зированные оценки выпускных экзаменов, средние оценки на старш их кур
сах и индексы избирательности в предыдущем примере были равно оцене
ны, итоговый результат коррелировал к ак 0.48 с последним факультетским
рейтингом. К орреляция была не только выш е, чем при клиническом оце
нивании комиссии (0.19), но она такж е была выш е, чем полученная на ос
нове значений, взяты х из половины выборки.
Пример ложной модели, который может быть интересен — по крайней
мере, ш ирокой публике — был инициирован врачом, который входил в со
став комиссии вместе со мной, когда я занимался системой прогнозирова
ния. Позднее, находясь в баре со своей женой и со мной, он сказал, что моя
статья могла быть интересна моим коллегам, но успешное обучение в аспи
рантуре в области психологии не представляет особого интереса: "Мог бы
ты, например, использовать одну из своих ложных моделей, чтобы пред
сказать, на сколько хорошо мы ладим с женой" — сказал он. Я понял, что
мог бы или возможно смог бы. В то время психологическое отделение уни
верситета ш тата Орегон занималось гендерными исследованиями, большин
ство из которы х были поведенчески ориентированы. Таким образом, участ
ники этих исследований фиксировали, когда они занимались любовью, ког
да они ссорились и когда они встречались (например, с родственниками суп-
руга/супруги) и т.д. Эти испытуемые такж е делали субъективные оценки
относительно того, насколько счастливы они были в семейной ж изни. Я сра
зу ж е подумал о лож ны х линейных моделях, чтобы спрогнозировать само
оценки семейного счастья: количество раз занятия любовью минус количе
ство ссор. Мой коллега Джон Ховард (John Howard) собрал такие данные о
супружеских парах, когда он был аспирантом в университете ш тата Миссу
ри, Канзас-Сити, где он работал с А лександер (A lexander, 1971). После того,
как бы ла установлена достоверность оценивания занятий любовью и ссор,
А лександер просила одного супруга из 42 пар контролировать эти события.
Она позволила нам анализировать данные, которые были получены: "В 30
парах, которые счастливы в браке (по мнению контролирую щ его супруга),
только две ссорились чащ е, чем занимались любовью. Все 12 пар, несчаст
ливых в браке, ссорились гораздо чащ е" (Howard & Dawes, 197б, с.478). Мы
повторили это исследование в университете ш тата Орегон, где 27 контроли
рующих супругов оценили счастье по 7-бальной ш кале, от "очень несчаст
ны" до "очень счастливы" с нейтральным средним баллом. К орреляция ч а
стоты занятий любовью минус частота ссор с этими оценками супружес
кого счастья составила 0.40 (р<0.05), ни одна из переменных не была значи
ма сама по себе. Исследование было повторено в ш тате Миссури Эдвардсом
и Эдвардсом (Edw ards & Edw ards, 1979) и в Техасе Торнтоном (T hornton,
450 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
1977а), которые обнаружили корреляцию 0.81 (р < 0.01) между различием
секс-ссоры и самооценками супружеского счастья среди 28 новых пар. (При
чина намного большей корреляции мож ет быть в том, что Торнтон получил
оценки супружеского счастья после, а не до того, к ак испытуемые фиксиро
вали занятия любовью и ссоры; действительно, одна из испытуемых реш и
ла развестись, осознав, что она чащ е ссорилась, чем занималась любовью;
T hornton, 1977b). Вывод заклю чается в том, что если мы любим больше,
чем ненавидим, мы счастливы; если мы ненавидим больше, чем мы любим,
мы несчастны. Этот вывод не является глубоким, ни психологически, ни
статистически. Однако эти грубые лож ные линейные модели прогнозиру
ют очень важ ную переменную: оценки семейного счастья.
Большой объем литературы (в действительности, весь) со времени публика
ции (1954) книги Мила поддерживает его обобщение о верных линейных моде
лях вместо интуитивных клинических оценок. Сойер (Sawyer, 1966) пересмот
рел большое количество подобных исследований, а некоторые из этих исследо
ваний были весьма обширными (Goldberg, 1965). Через 10 лет после опублико
вания его книги, Мил (1965) смог сделать вывод, что существовал единствен
ный пример, который показывал, что клинические оценки дают лучшие ре
зультаты, и это было сразу ж е оспорено Голдбергом (1968а) на основании того,
что даже этот пример не показывает существенного превосходства. Холт (H olt,
1970) критиковал детали некоторых исследований, и он даже предположил,
что прогноз, в отличие от понимания, не может являться важной частью кли
нического суждения. Однако обзор литературы не вы явил других исследо
ваний, в которых клиническое оценивание превосходило статистическое про
гнозирование, когда они были основаны на одинаковых исходных переменных.
И хотя большинство противников позитивизма согласится, что понимание не
синонимично прогнозированию, немногие оспорят то, что оно не подразумева
ет наличия способности прогнозировать.
Почему? Потому что люди - особенно эксперты в какой-либо области - на
много лучше выполняют отбор и кодирование информации, чем ее интегриро
вание.
Но люди действительно важ ны . Статистическая модель может вклю
чать информацию оптимальным способом, но всегда индивиды (эксперты,
кли ницисты , испытуемые) выбирают переменные. Кроме того, именно экс
перт знает направленные отнош ения между предсказываю щ ими перемен
ными и критерием и может закодировать переменные таким образом, что
они имеют ясные направленные отнош ения. И именно в подобной ситуа
ции, где предсказываю щ ие переменные являю тся хорошими и где они име
ют монотонные условные отнош ения с критерием, верная линейная модель
хорошо ф ункционирует3.
4Необходимо отметить, что верные линейные модели функционировали лучше, чем служа
щие либо их параморфичекие интерпретации. Используя ту же задачу, Бивер (Beaver, 1966)
и Дикон (Deacon, 1972) обнаружили, что линейные модели прогнозировали с точностью
приблизительно 78% при кросс-валидации. Но я не могу не подчеркнуть, что самая про
стая ложная модель функционирует лучше всего. Отношение активов к пассивам верно оха
рактеризовали 48 (80%) случаев, изученных Либби.
Устойчивая привлекательность ошибочных ... 455
оценивающего, или содержание. Если случайная модель функционирует
одинаково хорошо, эксперт не будет "следовать валидным принципам, но
следовать им недостаточно" (Dawes, 1971, с. 182), по крайней мере, не более
валидным признакам , чем любые другие, которые оценивают переменные
в правильном направлении.
Таблица 1 представляет 5 исследований, обобщенных Даусом и Коррига
ном (Dawes & C orrigan, 1974), в которых сравниваю тся валидности (то есть
корреляции), полученные различны ми методами. В первом исследовании,
861 пациент заполнили MMPI в различны х психиатрических больницах,
позднее они были разделены на невротических и психотических на основе
более обширной информации. Данные MMPI состоят из 11 множеств, к аж
дое из которы х представляет степень, в которой респондент отвечает на воп
рос способом, похожим на тот, которым отвечают пациенты , страдающие
явной формой патологии. С каждым пациентом связан набор из 11 множеств,
и проблема - это предсказать, будет ли дальнейш им диагнозом психоз (обо
значенный 1) или невроз (обозначенный 0). 29 клинических психологов "с
различны м опытом и образованием" (Goldberg, 1970, с.425) попросили сде
лать этот прогноз по 11-этапному нормализованному распределению. Два
других исследования рассматриваю т 90 аспирантов первого года обучения
на психологическом отделении в университете ш тата И ллинойс, которые
были выдвинуты на основании 10 переменных, способных предсказать ака
демический успех. Эти переменные вклю чали оценки теста на способности,
средние оценки в колледж е, отнесение к определенной категории (напри
мер, экстраверсия) и различны е самооценки (например, добросовестность).
Д ля всех аспирантов были посчитаны средние годовые оценки на первом
году обучения. Задача состояла в том, чтобы спрогнозировать средние оцен
ки, исходя из этих 10 переменных. Во втором исследовании этот прогноз
был выполнен 80 (другими) аспирантами в университете ш тата Иллинойс
(W iggins & Kohen, 1971), а в третьем исследовании этот прогноз был выпол
нен 41 аспирантом в университете ш тата Орегон. Детали четвертого иссле
дования уж е были обсуждены, оно рассматривает прогноз поздних оценок
способностей в Орегоне. В последнем исследовании (Y ntem a & Torgerson,
1961) экспериментаторы приписывали значения овалам, предложенным
испытуемым, на основе размера фигур, эксцентричности и насыщенности
серого цвета. Ф ормула, которая использовалась, была ij + kj + i k , где i,jvik
обозначают значения трех только что упомянутых измерений. Испытуемых
в этом эксперименте попросили оценить значения каж дого овала, и им пре
доставляли обратную связь исхода в конце каждого испы тания. Задача со
стояла в том, чтобы предсказать истинное (т.е. приписанное эксперимента
тором) значение каж дого овала на основе его размера, эксцентричности и
насыщ енности по цвету.
456 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
СО 05 Ob t-
TlJ со CO XO 05
© d d d d
CO b- X
XD XO CO
d d d d
о о X
со со °5
d d d d
м § *а
Нм
Таблица 1. Корреляции между значениями прогнозов и критерия
aä §>3 2 о tH fH 05
00 XD XO 00 X
IIМ d d d d d
§ «
rH о X XO о
co XO CSJ X
d d d d d
XSJ X
C 00 00 т05
Ч X
d d d d d
&
at
а
f i
ll!
S> О Ф
и иО* ъ
о U
с
Й О О
X ЕН ЕН
Устойчивая привлекательность ошибочных ... 457
П ервая колонка Таблице 1 представляет среднюю валидность экспертов в
этих исследованиях, а вторая представляет среднюю валидность парамор-
фической модели этих экспертов. Во всех случаях использовалось преды
дущее значение для расчета последующего. А затем идут случайные линей
ные модели, созданные Корриганом и мною, модели, в которы х значения
выбирались наугад, за исключением знака, а затем применялись к стандар
тизированным переменным.5
Знак каждой переменной был определен на предшествующей основе так, чтобы он имел
позитивное отношение к критерию. Затем из нормального распределения с единичной
дисперсией было выбрано наугад нормальное отклонение, и абсолютное значение этого
отклонения было использовано как вес перем енной. Д ля каж дого примера было
построено 10 тысяч таких моделей.(Daws & Corrigan, 1974, с. 102)
5К сожалению, Daws и Corrigan не описали подробно, что эти переменные сначала должны
быть стандартизированы, и что результат - зависимая стандартизированная переменная.
Равное или случайное взвешивание несравнимых переменных - например, оценка ВЭ (Вы
пускного Экзамена) (GRE) и средняя оценка (GPA), - без предварительной стандартизации
будет бессмысленным.
6 Рассмотрим набор стандартизированных переменных Х1? Х2, ... Хт, каждая из которых
положительно коррелирует со стандартизированной переменной Y. Корреляция среднего
значения X- Xmс Y равна корреляции суммы значений X с Y. Ковариация этой суммы с Y
равна:
) X * ( Xi l + X i2 ---+ x im)
И 1
'<7>£ v„
Дисперсия у равна 1, а дисперсия суммы значений X равно м + М(М-1) г \ где т - это сред
нее значение внутренней корреляции между значениями X. Следовательно, корреляция
средних значений X с Y равна( 2^У (М + М(М-1) г ) ; это больше, чем ( 2л,)/(М + М2- М =
среднее г.. Так как каждая из случайных моделей позитивно коррелирует с критерием. Кор
реляция среднего значения, которая является единично-взвешенной моделью, выше, чем
среднее значение корреляций.
458 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
В сущ ности, те ж е самые результаты были получены в процессе отбора
значения из прямоугольного распределения. Почему? Потому что линей
ны е модели устойчивы к отклонениям из-за оптимального взвеш ивания.
Д ругими словами, вывод использования предыдущего значения при расче
те последующ его, по крайней мере, в этих исследованиях, стал лиш ь под
тверждением более раннего откры тия, что правильны е линейные модели
превосходят суж дения человека - веса, полученные от экспертов, настоль
ко близки к оптимальным весам, что результаты моделей в высш ей степени
схож и. Одно из реш ений проблемы получения оптимального веса - в тер
минах фон Винтерфельдта и Эдвардса (von W interfeldt и Edw ards, 1973)- со
стоит в "категорическом максимуме”. Веса, близкие к оптимальному уров
ню, приводят почти к такому ж е результату, что и оптимальное бета-значе
ние. Так к ак эксперт знает, по крайней мере, хоть что-либо о направлении
переменны х, его суж дения порождают веса, близкие к оптимальному (од
нако, важ но, что во всех случаях равное значение превосходит модели, ос
нованные н а поведении оценивающего).
Н а тот ф акт, что различны е линейные формулы в высокой степени кор
релирую т друг с другом, было впервые указано 40 лет назад Вилксом (W ilks,
1938). Он рассматривал только те ситуации, в которых наблюдалась пози
тивная корреляция между предсказы ваю щ ими переменными. Такой ре
зультат имеет силу обычно в тех случаях, когда эти внутренние корреля
ции не являю тся негативными, например, корреляция между Х +2 Y и 2Х+Y
равна 0.80, когда X и Y - некоррелированные переменные. О тносительная
нечувствительность результатов к изменениям коэффициентов (при усло
вии отсутствия изменений в знаке) совсем недавно исследовались Грином и
Вайнером, Вайнером и Тиссеном, В. Едвардсом, Гардинером и Эдвардсом
(G reen (1977), W ainer (1976), W ainer и Tissen (1976), W . Edw ards (1978),
G ardiner и Edw ards (1975)).
Даус и Корриган (Dawes и C orrigan, 1974, с. 105) заклю чили, что “весь
фокус в том, чтобы знать, каки е переменные рассматривать, а затем уметь
склады вать". Этот принцип отлично иллю стрирует нижеследующ ее иссле
дование, проводенное с момента опубликования статьи Дауса и Корригана.
В нем Хеммонд и А лельман (Hammond и A delm an, 1976) к ак исследовали,
так и влияли на реш ение о том, какого типа пули следует использовать в
работе полицейским города Денвера, реш ение, имеющее гораздо более оче
видное социальное значение, чем большинство обсуждаемых ранее. Ц итата
из Х еммонда и А днльмана (Hammond и A delm an, 1976):
В 1974 году отделение полиции города Денвера (ОПД), равно как и другие отделения
полиции по всей стране, решили сменить амуницию. Основной причиной, предъявлен
ной полицией, было то, что официально принятые пули с закругленным концом обес
печивали недостаточную "останавливающую эффективность" (то есть, возможность
лишить способности двигаться и, таким образом, препятствовать раненому открыть
ответный огонь по полицейскому и другим людям). По рекомендации начальника ОПД
Устойчивая привлекательность ошибочных ... 459
(а также других начальников полиции) официальные пули были заменены пулями с
полым наконечником. Такие пули, как утверждалось, выравнивают удар, таким обра
зом, уменьшая степень проникновения, увеличивая останавливающую эффективность
и уменьшая потенциал рикошета. На предполагаемые изменения отреагировали Аме
риканский Союз Гражданских Свобод, меньшинства и другие. Противники изменений
заявляли, что новые пули были не чем иным, как запрещенными законом пулями "дум-
дум" , что они приводят к гораздо более серьезным телесным повреждениям, чем пули с
круглым концом, и, следовательно, должны быть запрещены. Как обычно, мнения по
этому поводу формировались в частном порядке, а затем публично отстаивались с дол
жным энтузиазмом и упорством, а также проводились обычные публичные слушания.
Обе стороны обращались к экспертам по баллистике за научной информацией и под
держ кой (с. 392).
В о зр а ж е н и я п р о ти в и с п о л ь зо в а н и я л и н е й н ы х м о д ел ей .
Эти возраж ения можно разделить на три обширных категории: техничес
кие, психологические и этические. Мы обсудим каждую категорию .
Технические
Наиболее распространенное техническое возраж ение направлено против
7 Следует отметить, что было лишь восемь пуль на Г р а н и ц е П а р ет о ; то есть, было только
восемь пуль, не являющихся низшими по качеству, чем какая-либо другая, как в отноше
нии останавливающей эффективности, так и в отношении возможности причинения вреда
(или низшими по одной из переменных и равными подругой). Следовательно, любое прави
ло распределения значения выбрало бы одну пулю из этих восьми.
Устойчивая привлекательность ошибочных ... 461
использования коэф фициента корреляции; например, Римас и Д ж иник
(Rem us и Jenicke, 1978, с. 221) писали:
"Ясно, что выбор Даусом и Корриганом коэффициента корреляции для установления
полезности случайных и единичных правил является несоответствующим (несоответству
ющим чему?). Также необходима функция критерия в экспериментах, цитируемых Да
усом и Корриганом. Несомненно, что существует и функция цены неправильной класси
фикации неврозов и психозов или отказа в поступлении в аспирантуру образованным
студентам, в то время как принимаются студенты с предельно низкими баллами."
П сихологические
Одно психологическое возражение против использования линейны х моде
лей находится в наш ей избирательной пам яти о клиническом предсказа
нии. Н аш а вера в такое предсказание подкрепляется доступностью (Tversky
& K ahnem an, 1974) примеров успешного клинического предсказания, - осо
бенно тех, что являю тся исключением некоторой формулы: "Я однажды знал
человека с..., которы й..." (например, "Я знал об одном человеке с IQ равным
только 130, который получил высокую степень по психологии”. К ак пока
зали Нисбетт, Боргида, Крендалл и Рид (N issbet, B orgida, C randall и Reed,
1976,7) такие единичные примеры часто имеют более сильное воздействие
Устойчивая привлекательность ошибочных ... 463
на суж дения, чем намного более достоверные статистические сведения, ос
нованные на многочисленных примерах. Хорошей профилактикой для кли
нических психологов, основывающих возражение статистическому предска
занию на таких примерах, было бы сохранение точных протоколов своих соб
ственных предсказаний о своих собственных пациентах, - будущие протоко
лы не попадают под прицел. Такие протоколы смогут сделать все примеры
успешного и неуспешного предсказания в равной степени доступными для
использования; в дополнение к этому, они могут быть полезны для другого
клинического исследования, в противовес статистическому, в смысле исполь
зования к ак наилучшего эксперта - самого клинициста.
Более того, иллю зия хорошего суждения может быть усилена из-за отбора
(Einhorn & H ogart, 1978) в тех ситуациях, когда предсказание положитель
ного или отрицательного исхода производит эффект самоисполнения. Напри
мер, экзаменаторы, решившие, что кандидат хорошо подготовлен для выпус
кной программы, могут чувствовать, что их суждение оправдано, если этот
кандидат успешен, даже хотя во многом успех кандидата является результа
том положительного воздействия самой программы. (В противовес этому,
линейная модель отбора оценивается по тому, насколько хорошо она прогно
зирует деятельность выбранных претендентов в пределах этой группы.) Или
официант, который полагает, что некоторые люди за столиком не платят хо
рош их чаевы х, может быть менее внимателен, чем обычно, и получить мень
ш ие чаевые, тем самым, оправдав свое клиническое суж дение.8
Второе психологическое возраж ение против использования линейны х
моделей основывается на их низкой "доказательной" валидности. Здесь су
ществует имплицитный (как противоположный эксплицитному) аргумент
из вакуума, так как не предполагаются ни изменения в оценочных процеду
рах, ни в экспертах, ни в критериях. Вернее, невысказанное предположение
состоит в том, что эти критерии психологической выгоды, в сущности, в вы
сокой степени прогнозируемы. Таким образом, следует, что, если один метод
прогнозирования (линейная модель) не работает достаточно хорошо, другой
может работать лучш е (основательный вывод), что далее трансформируется
в убеждение, что тот, другой, способ будет работать лучш е (что не является
основательным выводом), - если однажды он был обнаружен. Это возраже
ние наилучш им образом вы разил декан, рассматривавш ий принятие стар
ш екурсников в аспирантуру, который написал: "Корреляция линейной ком
бинации с будущим факультетским рейтингом составляет только 0.4, тогда
как корреляция суждений приемной комиссии - 0.2. Дважды ничего равня
ется ничего". В 1976 году я ответил следующее (Dawes 1976, с.6-7):
В ответ я могу только отметить, что 16% изменений лучше, чем 4%. Для меня, однако,
очаровательной частью этого довода является подразумеваемое предположение, что
другие 84% изменений прогнозируемы, и мы можем их каким-то образом предсказать.
Эт ические
Когда я был прош лым летом на Я рмарке Ренессанса в Лос-Анджелесе, я
случайно услы ш ал жалобы одной ж енщ ины , что она бы ла "ужасно неспра
ведливо" отвергнута на психологическом ф акультете в Университете К али
форнии, Санта-Барбара, на основании одних лиш ь цифр, даж е без интер
Устойчивая привлекательность ошибочных ... 465
вью. "К ак они могут сказать, к ак ая я ? ” Ответ состоит в том, что они не мо
гут. Равно к ак и с интервью (K elly, 1954). Тем не менее, многие люди при
держиваю тся мнения, что делать реш ающ ий социальный выбор без интер
вью негуманно. Я думаю, что вопрос о том, обращаются ли с людьми спра
ведливо, более соответствует вопросу о том, были или нет с ними гуманны,
чем к вопросу о том, встречались ли с ними лично. (Некоторые из наихуд
ш их докторов проводят большое количество времени в разговорах со свои
ми пациентами, не читаю т медицинских журналов, делают мало или не де
лаю т вовсе анализов и горюют на похоронах.) Средние оценки представляет
поведение претендента в течение 3,5 лет. (Конечно ж е, не все профессора
имеют предубеждение относительно особой формы креативности претенден
та.) Балл вы пускны х экзаменов является более тщ ательно продуманной
проверкой. Н еужели мы действительно считаем, что мы справимся с этой
работой лучш е или справедливее 10-минутной оценкой документов из лич
ного дела или получасовым интервью , чем могут сделать эти две простые
цифры? Такое когнитивное самомнение (Dawes, 1976, с. 7) неэтично, особен
но учиты вая ф акт отсутствия очевидного доказательства того, что мы это
сделаем лучш е, чем линейное уравнение. (Но даж е исклю чения необходи
мо делать с предельной осторожностью, если это должно быть этично; так
как если мы примем кого-нибудь с предельно низким и линейными показа
телями на основании того, что у него или нее есть особый талант, мы автома
тически откаж ем кому-то с более высокими оценками, кто с большой веро
ятностью может иметь в равной степени впечатляю щ ий талант, если бы мы
принялись его оценивать.)
Не имеет значения, насколько сильно измененным мы хотим видеть тот
или иной аспект в том или ином исследовании, рассмотренном в этой ста
тье. Не имеет значения, насколько психологически независимыми или не
приятны м и мы находим их результаты . Не имеет значения, насколько эти
чески неудобно мы себя чувствуем, "приравнивая людей к простым циф
рам ". Ф актом остается то, что наш и клиенты - это лю ди, заслуживаю щ ие
возможного наилучш его отнош ения. Если это означает, - к ак это происхо
дит в настоящ ее время, - что отбор, диагностика и прогнозирование долж
ны основываться не более, чем на сумме чисел, представляю щ их оценки по
важ ны м характеристикам, то так оно и должно быть. Поступать иначе оз
начает обманывать людей, которы м мы служ им.
29. Жизнеспособность мифических чисел*
Макс Зингер
*Эта глава первоначально появилась в The Public Interest, 1971, 23,3-9. Авторское право
© 1971 у National Affairs, Inc. Печатается по разрешению.
Жизнеспособность мифических чисел 467
часть стоимости героина покрывает, скорее, участие в наркоторговле, чем
обкрадывание общества, а другая больш ая часть покрывается за счет про
ституции, вклю чая мужчин-наркоманов, ж ивущ их за счет проституток. Но
независимо от того, насколько тщ ательно это рассматривать, если пы тать
ся дать оценку собственности, украденной наркоманами, предположив, что
их 100.000, и оценив минимальную сумму, которую им необходимо будет
украсть, чтобы поддержать себя и свои привы чки (после оценивания закон
ного дохода), то приходиш ь к цифре, соседствующей с $1млрд. в год для
Нью -Йорка.
Но что произойдет, если подойти к этому вопросу с другой стороны? Пред
полож им, мы спраш иваем: “Какое количество собственности украдено -
наркоманами или кем-либо ещ е?” К раж наркоманов должно быть меньш е,
чем суммарное количество краж . К акова ценность собственности, украден
ной в Нью-Йорке в год? Когда я спросил в первый раз, мне показалось не
сколько удивительным, что на этот вопрос, к ак оказалось, достаточно труд
но ответить, даж е приблизительно. Ни у кого нет оценок, в которы х они
имели бы хоть наименьшую уверенность, и вопрос, казалось, задавался не
часто. Сумма официально заявленны х краж в Нью-Йорке составляет при
близительно 300 млн. в год, из которы х около 100 млн. приходится на авто
мобильные краж и (преступления, редко совершаемые наркоманами). Но
ясно, что о большом количестве краж не заявлено; например, обычно не за
являю т в полицию о магазинны х краж ах. (Об огромных потерях собствен
ности не сообщается такж е и в страховые компании, и страховая индустрия
не имеет истинной оценки суммарных краж .)
Однако оказы вается, что если кто-то просто задает вопрос типа: “Возмож
но ли, что наркоманы украли собственности на $1 млрд, в прошлом году в
Н ью -Й орке?”, то относительно легко оценить, на какую сумму украдено
собственности. Ясно, что два больш их компонента краж наркоманов - это
магазинны е краж и и краж и со взломом. К акова может быть ценность соб
ственности, украденной наркоманами в магазинах? Вся розничная торгов
л я в Нью-Йорке составляет порядка $15 млрд, в год. Сюда входят автомо
били, ковры , бриллиантовые кольца и другие изделия, недоступные для м а
газинны х воров. Разум ная потеря имущ ества в учреж дениях розничной
торговли составляет 2% . Сюда входят растраты руководства, краж и клер
ков, в транспортно-погрузочном отделе, водителей и т.д. (Универмаги, в
частности, сообщают о большом увеличении магазинны х краж в последние
годы, но они находятся в числе наиболее уязвимы х учреждений розничной
продаж и и не так сущ ественны, чтобы намного увеличить общую норму в
2% .) Общепринято, что существенно больше, чем половина собственности,
исчезнувш ей из учреждений розничной торговли, выносится сотрудника
м и, а остаток - магазинными ворами со стороны. Но давайте припиш ем им
1% всей украденной собственности, продававш ейся в розницу в Нью-Йор
ке, - это будет $150 млн. в год.
468 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
А как ж е насчет краж и со взломом? В Нью-Йорке где-то 2,5 млн. домашних
хозяйств. Предположим, в среднем 1 из 5 домов подвергается грабежу или кра
ж е со взломом каждый год. Здесь учитывается, что в некоторых районах краж и
со взломом являются обычным явлением, и что некоторые дома подвергаются
краж е со взломом даже более 1 раза в год. Средняя ценность собственности, вы
носимой при краж е со взломом, может быть порядка $200. При некоторых кра
ж ах со взломом, конечно ж е, выносится гораздо больше собственности, но такие
ценные краж и совершаются намного реже и часто профессиональными ворами,
не являющ имися наркоманами. Если мы используем цифры $200 х 500.000
краж , мы получим, что за год в Нью-Йорке из домов людей совершаются кражи
имущества на сумму $100 млн.
Очевидно, ни одно из этих оцененных значений не является ни несомненным,
ни достаточно обоснованным. Вы можете сделать собственную оценку. Оценки
здесь носят такой характер, что было бы очень удивительно, если бы они ошиба
лись в 10 раз, и не очень важно для заключения, если бы они ошибались в 2 раза.
( Это хорошая позиция, в которой может находиться оценивающий.)
Очевидно, что не все краж и наркоманов - это собственность, взятая из
магазинов и домов. Наиболее ужасаю щ ие типы преступлений, соверш ае
мые наркоманами - это краж и собственности при разбойном, хулиганском
нападении на ж ителей Нью-Йорка. И мы можем их оценить. Предположим,
что в среднем каж ды й год один человек из десяти подвергается разбойному
или хулиганскому нападению с краж ей собственности. Это будет 800.000
таких нападений, и если в среднем человек отдает $ 100 (что маловероятно),
в такой форме к раж ежегодно изы мается $8 млн.
Таким образом, мы видим, что, если приписать наркоманам все м агазин
ные краж и , все краж и в домах, все краж и у отдельных людей, общ ая сто
имость собственности, украденной наркоманами в Нью-Йорке, составляет
где-то $330 млн. загод. Можно перебросить сюда все “поправочные м нож и
тели”, каки е пож елаеш ь, прибавить все другие разнообразные преступле
н и я, соверш аемые наркоманами, но что бы ни было сделано, трудно найти
основания для той оценки, что наркоманы воруют более половины м илли
арда в год, а четверть миллиарда вы глядит более правдоподобной оценкой,
хотя и, возможно, по максимуму. В конце концов, есть ж е воры, не являю
щ иеся наркоманами.
Таким образом, я уверен, мы показали, что, несмотря на общепринятое
предположение о том, что наркоманы в Нью-Йорке воруют от $2 до $ 5 млрд,
в год, реальная цифра в десять раз меньше, и что это можно продемонстриро
вать пятью минутами размыш лений. *Так что ж е? Даже на сумму в четверть
миллиарда - это все ж е много собственности. Эта цифра превышает суммы,
ниям сказала — $12 млрд., Вирджил Петерсон из Чикаго сказал — $30 млрд. Мы выбрали
$20 млрд, как баланс между этими двумя.
Необычный пример мифических чисел, имевший огромную силу, — утверждение, что по
лицией было застрелено 28 Черных Пантер, - подробно описывался Эдвардом Джеем Эп
штейном в газете The New Yorker от 13 февраля, 1971 года. (Оказалось, что было убито 19
Пантер, 10 — полицией, из которых 8 — в ситуациях, когда Пантеры, вероятно, были ак
тивны).
2Параллельные данные были получены в более позднем исследовании в Больнице Св. Луки
81 наркомана — средний возраст 34 года. Больше половины героина, потребляемого этими
470 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
Наиболее популярная, неофициальная оценка количества наркоманов в
Нью -Йорке - 100.000 с плюсом (обычно с акцентом на “плюс”). Ф едераль
ный реестр а Ваш ингтоне насчитывает 30.000 наркоманов в Нью-Йорке, а
реестр имен наркоманов Нью -йоркского департамента здоровья - 70.000.
Н есмотря на то, что не все люди в этих списках все еще являю тся активны
ми наркоманами, - многие из них умерли или в тюрьме, - большинство по
лагает, что многие наркоманы вообще не попали ни в один из этих спис
ков. Обычно оценку, что в Нью-Йорке 100.000 наркоманов, считаю т очень
консервативной. В начале 1970 года ш ироко цитировали оценку доктора
Д ж удиан Денсен-Джербер (D r. Judiarm e D ensen-G erber), что к концу лета
будетболее 100.000подростков-наркоманов. Очевидно, однако, что есть еще
и наркоманы старш е 20 лет.* 3
Обсуждая в этой статье вопрос количества наркоманов, мы будем гово
рить о таком человеке, о котором думаешь, когда употребляешь термин “нар
ком ан”.4 Лучш им термином, возможно, будет “уличны й наркоман”. Это
человек, обычно употребляющий героин каж ды й день. Это такой человек,
которы й вы глядит и действует согласно обычному образу наркомана. Мы
исклю чаем здесь представителей медицинской профессии, которые часто
использую т героин и другие наркотики или пристрастились к ним, студен
тов, употребляю щ их героин от случая к случаю, состоятельных людей, хотя
и зависимых, но которым не нужно воровать и часто посещать обычные при
тоны наркоманов, и т.д. Когда мы обращаемся к “проблеме наркомании”,
гораздо менее важ но вклю чать эти случаи; несмотря на то, что они все ж е яв
ляю тся проблемами в той или иной степени, однако проблемами совершенно
другого типа, чем та, что поставлена типичным уличным наркоманом.
наркоманами за год, было оплачено его продажей. Между прочим, в среднем каждый из
этих наркоманов украл за предыдущий год собственности на $9.000.
3 Среди последних исследований, пытающихся дать оценку, мы можем отметить марксис
та Sol Yurick, давшего нам “500.000 отбросов” (Monthly Review, декабрь, 1970), и William
R. Corson , который утверждал в Penthouse за декабрь 1970 года, что “сегодня по меньшей
мере 2. 500.000 черных американцев посажено на героин”.
4 Существует интересная аномалия, касающаяся слова “наркоман”. Большинство людей,
если бы их попросили дать определение слову “наркоман”, сказали бы, что это человек, ко
торый регулярно принимает героин (или подобный наркотик), и у которого, если не удается
достать обычную дозу героина, будут наблюдаться неприятные и болезненные ответные
симптомы. Но это определение не будет применимо к большей части тех, кого обычно при
знают как “совокупность наркоманов”. В действительности, оно не будет применимо к боль
шинству настоящих наркоманов. Наркоман, которого очистили от токсинов, или который
находился в тюрьме и был огражден от наркотиков в течение недели или около того, не
соответствует обычному определению “наркомана”. У него уже нет физических симптомов
в результате воздержания от героина. “Осел” Рейли (“Donkey” Reilly), конечно же, отвечает
понятиям большинства людей о наркоманах, но в течение 30 лет из 54, когда он был “нар
команом”, он находился в тюрьме и, конечно же, не был активно зависим от героина боль
шую часть времени, поведенного там, что составляет больше половины его карьеры “нарко
мана” (хотя определенное количество наркотиков доступно и в тюрьме).
Жизнеспособность мифических чисел 471
По количеству собственности, украденной наркоманами, можно полагать,
что в Нью-Йорке их скорее 70.000, чем 100.000, и почти наверняка не может
быть 200.000, как иногда утверждают. Некоторые другие простые способы
оценки количества уличных наркоманов приводят к подобным результатам.
И сследователи, имеющие дело с совокупностью наркоманов, приш ли к
оценке, что средний уличный наркоман проводит от 1/4 до 1/3 своей ж изни
в тюрьме. (Некоторые из тех, кто изучает эту тему, такие к ак Edw ard Preble
и Jo h n J . Casey, J r ., полагают, что в среднем более 40% .) Это подразумева
ет, что в любое время от 1/4 до 1/3 всех наркоманов находятся в тюрьме, и
что общее число наркоманов может быть оценено при умножении количе
ства наркоманов в тюрьмах на 3 или 4. Конечно ж е, количество наркоманов
в тюрьме не является известной величиной (и, в действительности, к ак мы
указы вали выш е, даж е не совсем точно отвечает понятию). Однако можно
все ж е сделать приемлемую оценку количества наркоманов в тюрьме (и для
этой цели мы можем задействовать наркоманов в различны х учреж дениях
принудительного лечения). Это количество приблизительно равно 14.000 -
17.000, что вполне совместимо с оценкой количества уличны х наркоманов
в Н ью -Й орке, составляющ ей 70.000.
Другим способом оценки общего количества уличны х наркоманов в Нью-
Йорке является использование имеющ ейся демографической информации
о совокупности наркоманов. Н апример, мы можем небезосновательно быть
уверенными в том, что где-то 25% уличны х наркоманов в Нью-Йорке - это
пуэрториканцы , а где-то 50% - афро-американцы. Мы знаем, что прибли
зительно 5 из б уличны х наркоманов - это муж чины , и что 50% попадают в
возрастную категорию от 16 до 25 лет. Это будет означать, что 20% общего
количества уличны х наркоманов - это чернокож ие муж чины в возрасте от
16 до 25 лет. Если наркоманов 70.000, то это будет означать, что 14.000 афро
американцев в возрасте от 16 до 25 лет являю тся наркоманами. Но всего в
городе около 140.000 афро-американцев в возрасте от 16 до 25 л ет-в о зм о ж
но, половина из них ж ивет в бедных районах. Это означает, что если в горо
де 70.000 наркоманов, то 1 из 10 молодых афро-американцев - наркоман,
если 100.000 наркоманов - то 1 из 6, если 200.000 - то 1 из 3. Вы можете
реш ить сами, к ак ая из степеней охвата группы молодых муж чин афро-аме
риканцев более вероятна, но понятно, что 200.000 наркоманов - неправдо
подобное количество. Подобным образом, количество уличны х наркоманов
70.000 будет подразумевать, что 7.000 молодых пуэрториканцев-муж чин -
наркоманы , а общее количество пуэрториканских парней в возрасте от 16
до 25 лет в Нью-Йорке - около 70.000.
Ни одно из выш еперечисленных вычислений ни в коем случае не пы та
ется свести н а “нет” значение проблемы героиновой зависимости. Героин
это уж асное проклятие. Когда думаеш ь об индивидуальной трагедии, то
70.000 - это ужасающ е большое количество наркоманов. И если тебе необ
ходимо зарабаты вать на ж изнь, то $250 млн - это ужасаю щ е огромные день
ги, которы е воруют у граж дан города с тем, чтобы, пройдя через руки нар
команов и торговлю крадены м, они осели в карманах тех, кто ввозит и рас
пространяет героин, и тех, кто берет взятки и оказы вает другие услуги для
героиновой индустрии.
Главным моментом этой статьи может быть иллю страция того, к ак дале
ко можно зайти в рассмотрении проблемы, серьезно относясь к цифрам, к
тому, что они подразумевают, проверяя различные выводы друг относитель
но друга и относительно общей информации (такой к ак количество людей
или домов в городе). Н езначительны е усилия в этом направлении могут
иметь большое значение для помощи обычным людям и должностным ли
цам в том, чтобы справиться с различного рода экспертами.
30. Интуитивное прогнозирование: предубеждения
и корректирующие процедуры*
Д а н и е л ь К а н е м а н и А м о с Т вер с к и
П р ед и сл о в и е
Лю бая значительная деятельность по прогнозированию вклю чает весомый
компонент суж дений, интуиции и развитой догадки. В самом деле, мнения
экспертов являю тся источником многих технологических, политических и
социальных прогнозов. М нения и интуиция играю т важную роль даже там,
где прогнозы получают в результате использования математических моде
лей или имитации. И нтуитивные суж дения использую тся при выборе пе
ременны х, рассматриваемых в таких моделях, приписанных им факторов
влияния, а такж е их предполагаемых начальны х значений. К ритическая
роль интуиции в прогнозировании любого рода требует анализа факторов,
которые ограничиваю т точность экспертны х суждений, а такж е разработ
ки процедур, направленных на улучш ение качества этих суждений...
Е д и н и ч н ы е сл у ч аи и д а н н ы е р а с п р е д е л е н и я
От экспертов часто требуют предоставления наи лучш их догадок, оценок или
прогнозов, касаю щ ихся неопределенных величин, таких к ак индекс Доу-
Д ж онса в определенный день, будущие продаж и продукта или результаты
выборов. Следует различать два типа информации, имеющ ейся в распоря
ж ении прогностика: данные случая и данные распределения. Единичная
инф ормация или данные случая, состоит из очевидных свидетельств по ча
стному рассматриваемому случаю. Данные распределения, или данные ба
зового значения, остоят из знаний о распределении исходов в подобных си
Р е гр е с с и я и и н ту и ти в н о е п р о гн о зи р о в а н и е
В больш инстве прогностических проблем эксперт имеет к ак единичную
информацию о специфическом случае, так и данные распределения об исхо
дах в подобных случаях. Примерами могут быть консультант, прогнозирую
щ ий вероятные достижения студента, банкир, оценивающий потенциальную
прибыль малого бизнеса, издатель, оценивающий продажу учебника, или эко
номист, прогнозирующий некоторый индекс экономического роста.
476 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
К ак люди прогнозируют в таких ситуациях? Психологическое исследо
вание полагает, что интуитивное прогнозирование генерируется согласно
простому правилу сопоставления (m atching): прогнозируемое значение вы
бирается таким образом, чтобы положение случая в распределении исходов
соответствовало его положению в распределении впечатлений (K ahnem an
& Tversky, 1973,4; Ross, 1977). Следующий пример иллю стрирует это пра
вило. Редактор просмотрел рукопись романа и был приятно удивлен. Он ска
зал: “Эта книга читается к ак бестселлер. Среди книг такого типа, издавае
мы х за последние годы, я бы сказал, только 1 из 20 оказала на м еня большее
впечатление”. Если бы редактора попросили оценить продаж у романа, он
бы, возможно, предсказал, что она будет на уровне первых пяти процентов
распределения продаж.
Имеются значительны е свидетельства того, что люди часто прогнозиру
ют путем сопоставления прогноза и впечатления. Однако это правило про
гнозирования необоснованно, так к ак оно не может принимать во внимание
неопределенность. Редактор из наш его примера, несомненно, отметил бы,
что продаж а книг в высш ей степени непредсказуема. В подобной ситуации
с высокой неопределенность наилучш ий прогноз продажи книг должен бы
находиться где-то между значением, соответствующим чьему-то впечатле
нию , и средним значением продаж книг подобного типа.
Один из основных принципов статистического прогнозирования, кото
ры й такж е является одним из наименее интуитивны х, состоит в том, что
предельность прогнозирования необходимо сдерж ивать рассмотрением
предсказуемости. Представьте, например, что издатель знает из прошлого
опы та, что продаж а книг совсем не связана с его начальны ми впечатления
ми. Рукописи, которые произвели на него благоприятное впечатление, и те,
которы е ему не понравились, в равной степени могли бы продаваться к ак
хорошо, так и плохо. В таком случае нулевой прогностичности наилучш ая
догадка издателя - это одинаковая продаж а всех книг, например, среднее
значение соответствующей категории, независимо от его личного впечатле
н ия об одной из книг. Позволительно сопоставлять прогнозирование и впе
чатление только в случаях совершенной прогнозируемости. В промежуточ
ны х ситуациях, которые, конечно ж е, наиболее часты , прогнозирование
должно быть регрессивным; то есть, оно должно быть меж ду средним зна
чением по классу и значением, наилучш им образом представляю щ им чье-
либо впечатление в конкретном случае. Чем ниж е прогнозируемость, тем
ближ е долж ен быть прогноз к среднему значению по классу. Интуитивное
прогнозирование типично является не регрессивным: люди часто делают
предельный прогноз на основе информации, чья надежность и прогности
ческая валидность заведомо низки...
Интуитивное прогнозирование... 477
К о р р ек ти р у ю щ а я п р о ц ед у р а д л я п р о гн о за
Чем руководствуется эксперт, чтобы надлеж ащ им образом осуществить
регрессивное прогнозирование? Что приводит его к использованию доступ
ной ему единичной информации и данные распределения в соответствии с
принципами статистического прогнозирования? В этом разделе предлага
ется пяти-ш аговая процедура, позволяю щ ая достичь этих целей.
Ш аг 3: И н т уи т и вн а я оценка
Одна часть информации, которой располагает эксперт о проблеме, получена
из распределения исходов в референтном классе. К тому ж е, у эксперта обыч
но имеется значительное количество единичной информации о частном слу
чае, которая отличает его от других членов класса. Теперь следует попросить
эксперта дать интуитивную оценку на основе этой единичной информации.
К ак было отмечено ранее, эта интуитивная оценка, вероятнее всего, будет
нерегрессивной. Цель двух следующих ш агов процедуры состоит в коррек
тировке этого предубеждения и получении более адекватной оценки.
Ш аг 4: О ценивание прогнозируемости
Теперь эксперт долж ен оценить степень, в которой тип имею щ ейся по это
му случаю информации позволяет точное прогнозирование исходов. В кон
тексте линейного прогнозирования соответствующей мерой прогностично-
сти явл яется/), корреляция Пирсона между прогнозированием и результа
тами. Там, где есть данные о прошлом прогнозировании и исходах, требуе
Интуитивное прогнозирование... 479
мое значение можно получить из них. При отсутствии таких данных необ
ходимо полагаться на субъективное оценивание прогнозируемости. Стати
стически опытный эксперт сможет дать точную оценку р на основе своего
опыта. Когда статистический опыт отсутствует, аналитак должен прибег
нуть к менее прямы м процедурам.
Одна из таких процедур требует сравнения прогнозируемое™ перемен
ной, с которой он имеет дело, с прогнозируемостью других переменных.
Например, эксперт может быть совершенно уверен, что его способность про
гнозировать продажу книг превосходит способность спортивных экспертов
прогнозировать распределение очков в футбольных матчах, но она не так
хороша, к ак способность синоптиков прогнозировать температуру на два
дня вперед. Искусный и старательный аналитак мог бы построить прибли
зительную ш калу прогнозируемое™ , основанную на вычисленной корре
ляции между прогнозированием и исходами для набора феноменов, пред
сказуемость которых колеблется от высокой (например, температура) до
низкой (например, стоимость акций). Тогда анали так просил бы эксперта
определить местоположение прогнозируемое™ целевого количества на этой
ш кале, таким образом, давая численную оценкур.
А льтернативный метод оценивания прогнозируемости вклю чает вопро
сы типа: Если бы вам необходимо было рассматривать два романа, которые
вы собираетесь опубликовать, к ак часто были бы вы правы в прогнозирова
нии, который из них будет продан в большем количестве? Оценка порядко
вой корреляции между прогнозированием и исходами в этом случае может
быть получена следующим образом: ес лир -э т о оцененная доля пар, в кото
рых порядок исходов был правильно спрогнозирован, то г = 2рЛ дает ин
декс точности прогноза, который ранж ируется от 0, когда прогнозирование
находится на уровне ш анса, до 1, когда прогнозирование является совер
шенно точным. Во многих ситуациях г - может быть использована, к ак гру
бое приближение к р .
Делать оценку прогнозируемости нелегко, и она долж на тщ ательно рас
сматриваться. Эксперт может быть подвержен ош ибке ретроспективного
взгляда (Fischhoff, 1975), которая ведет к переоценке прогнозируемости
результатов. Эксперт такж е может быть подвержен предубеждению доступ
ности (Tversky & K ahnem an, 1973,11) и может вспомнить, большей частью ,
удивительные или запоминаю щ иеся случаи, в которых сильные первона
чальны е впечатления были подтверждены позднее.
З а к л ю ч и т е л ь н ы е за м е ч а н и я
П редставленный здесь подход основан на следующ их общих понятиях о
прогнозировании. Во-первых, что больш ая часть предсказаний и прогнозов
Интуитивное прогнозирование... 481
содержит несократимый интуитивны й компонент. Во-вторых, что интуи
тивное прогнозирование знаю щ их людей содержит много полезной инфор
мации. В-третьих, что такие интуитивны е суж дения часто являю тся пре
дубежденными предсказуемым способом. Таким образом, проблема состо
ит не в том, принимать ли интуитивное прогнозирование по внеш нему зна
чению или отвергать его, а скорее как его можно освободить от предубежде
ний и улучш ить.
А нализ суждений людей показы вает, что многие интуитивные предубеж
дения вырастаю т из тенденции придавать малое значение определенным
типам информации, например, базовым частотам исходов и их предказуе-
мости. Стратегия освобождения от предубеждений, представленная в этой
статье, состоит в попытке получить от эксперта релевантную информацию ,
которой он обычно пренебрегал бы, и помочь ему интегрировать эту инфор
мацию с его интуитивными впечатлениями таким образом, чтобы учесть
основные принципы статистического прогнозирования....
31. Освобождены« от предубеждения*
Барух Фишхофф
*Выражаю свою благодарность Ruth Beyth-Marom, Don MacGregor и Paul Slovic за их полез
ные комментарии к ранним проектам этой статьи. Эта работа была поддержана Службой
морских исследований согласно контракту № 000 14-80-С-0150 с Perceptronics, Inc.
Освобождение от предубеждения 483
ряли точность этого приближ ения, рассматривая пределы очевидного успе
ха людей. Сможет ли лучш ее суждение сделать их богаче или здоровее?
Можно ли отнести их успех на счет их снисходительного окруж ения, кото
рое не предполагает особенно осведомленного поведения? Трагические ошиб
ки обеспечивают важную способность проникновения в природу и качество
процесса принятия реш ений у людей; к счастью, они довольно редки, так
что у нас слиш ком м аленькая база данных, чтобы определить факторы , ко
торые могут сбивать людей с пути. Исследование суждений использовало
деструктивно-проверяющую стратегию для генерирования подверженных
предубеждению суждений в ситуациях охарактеризованных с умеренной
точностью. Теоретик надеется, что появится модель ошибок и успехов, ко
торая послуж ит для нескольких возможных объяснений. Таким образом,
исследование предубеждений проясняет источники и пределы очевидной
мудрости, точно так ж е, к ак исследование освобождения от предубеждений
проясняет источники и пределы очевидной глупости. Оба являю тся суще
ственными для изучения суждений.
Хотя некоторые исследования суждений являю тся, прежде всего, демон
страцией того, что определенное предубеждение может появиться в некото
рых, возможно, выдуманных, условиях, многие другие исследования пред
принимали попытки подтасовки данных против наблюдения предубеждений.
Некоторые из этих исследований являю тся освобождающими от предубеж
дений, и они проводятся в надежде, что процедуры, доказавш ие свою эффек
тивность в лабораторных условиях, такж е будут способствовать улучшению
результатов и в естественных условиях. Другие имеют более теоретическую
цель прояснить контекст, вызывающ ий субоптимальные суждения. Сущ
ность этого раздела состоит в обзоре исследований, которые можно истолко
вать, как попытки уменьшить два обычных предубеждения — предубежде
ние ретроспективного взгляда и -гоезмерную уверенность. Он рассматривает
неудачи, равно как и успех, в убеждении, что (а) неудача помогает прояснить
опасность проблемы и необходимость корректирую щ их или защ итных мер,
и (б) общая модель исследований является ключом к открытию психологи
ческих измерений, важных при характеристике жизненных ситуаций и пред
видении степени их подверженности предубеждению.
Мы стремились к полноте обзора, придерж иваясь следующих трех отбо
рочных критериев:
1. Рассматриваю тся только исследования, опубликованные в ис
точниках с подобными обзорами. Таким образом, ответственность
за контроль качества экстернализирована.
2. Исклю чаются эпизодические свидетельства (с некоторыми ис
клю чениями). Х отя такие отчеты являю тся главным источником
информации о некоторых видах попыток освобождения от преду
беждений (например, использование экспертов), они подвержены
интерпретационному и отборочному предубеждениям, которые тре-
484 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
буют особого вним ания вне сферы этого излож ения (см. Главу 23).
3. П редполагается некоторое эмпирическое основание. И склю чаю тся
предполож ения, которые еще необходимо проверить, и теоретические до
воды (например, об экологической валидности экспериментов), которые
невозможно проверить.
Перед обзором будет предложено основание для попыток освобождения
от предубеждений, характеризую щ ее возможные подходы и предположе
н и я, леж ащ ие в их основе. Такое основание может обнаружить повторяю
щ иеся модели, будучи примененным к разнообразным предубеждениям в
суж дениях.
М етоды о св о б о ж д ен и я от п ред у б еж д ен и й
Когда сущ ествует проблема, вполне естественно искать виновного. Проце
дуры освобождения от предубеждения наиболее ясно могут быть категори
зированы согласно подразумеваемому безусловному утверждению о винов
ности . Наиболее важное различие состоит в том, лож ится ли ответственность
за предубеждение на человека, принимающ его реш ение, на задачу или на
определенное несоответствие между ними. Представляю т ли предубежде
н и я артеф акты некомпетентного экспериментирования и сомнительной
интерпретации, четкие случаи ошибочных суждений или неудачный резуль
тат деятельности экспертов, имею щ их, но неправильно применяю щ их ког
нитивны е умения? К ак подытожено в табл. 1 и описано ниж е, каж дая из
этих категорий мож ет подразделяться дальш е согласно тому, что можно
назвать глубиной проблемы. Н асколько фундаментальна сложность? Необ
ходимы ли технические или структурные изменения? Стратегии для разра
ботки техник освобождения от предубеждений различны для различны х
причинны х категорий.
Ошибки экспертов
Способные к совершенствованию. Если проблема бы ла хорошо проработа
на, а предубеждение осталось, некоторую ответственность должен принять
на себя респондент. Чтобы ликвидировать неж елательное поведение, необ
ходимо использовать эскалационны й план с ш агами, отражаю щ ими уве
личиваю щ ийся пессимизм в отношении легкости соверш енствования вы
полнения задачи человеком: (а) предупреждение о возможности возникно
вения предубеждения без определения его природы (эта стратегия отлича
ется от поощ рения людей работать более усердно, подразумевая, что потен
циальная ош ибка является систематической, и респондентам нуж на инст
рукция, а не просто благоприятный случай); (б) описание направления (а,
возможно, и степени) предубеждения, которое типично наблюдается; (в)
обеспечение определенной порции обратной связи, персонифицирующей то,
что подразумевается в предупреждении; (г) предложение обширной програм
мы тренировки с обратной связью , тренерства и всего, что необходимо для
когнитивного мастерства респондента в задаче.
Такие ш аги обвиняют оценивающего, а не задачу, предполагая, что ре
ш ения не возникнут самопроизвольно или только лиш ь при тщ ательном
перефразировании вопросов. Несмотря на огромный практический вклад,
тренировка мож ет ограничить теоретическое влияние. П опытка найти спо
соб, который работает, может привести к созданию целого набора манев
ров, чьи элементы эффективности плохо определены. Тогда, может, будут
нужны более систематические эксперименты, чтобы идентифицировать эти
элементы. Конечная цель — это понимание того, чем отличается искусст
венный опыт, полученный в тренировочных программах, от естественного
опыта, предлагаемого жизнью . Почему одна техника по ликвидации пре
дупреждения работает, тогда к ак другая нет?
Ошибки экспертов
У читься избегать предубеж дений, возникаю щ их оттого, что являеш ься
пленником собственной современной перспективы , — вот что составляет
фокус тренировки историков (см .гл.23). Однако не проводилось никаких
эмпирических исследований успешности таких попыток. А кцент, который
историки делают на первичны х источниках с их отчетами восприятия про
ш лого, может отраж ать ощ ущ ение, что человеческое сознание достаточно
неисправимо, чтобы изучать дисциплину такого рода по документам. Одно
из исследований по экспериментальной тренировке, хотя и использует зна
чительно менее строгую процедуру, не дает никаких оснований для опти
мизма. Fischhoff (1977b) ясно описы вал это предубеждение испытуемым и
просил их избегать его в своих суж дениях — напрасно.
Резюме
Будучи хотя и одной из наименее изучавш ихся проблем, предубеждение рет
роспективного опыта побудило проведение достаточного количества исследо
ваний, чтобы сделать возможными некоторые общие экспериментальные ут
верждения: оно достаточно устойчивое и широко распространенное. Чтобы его
уменьшить, необходимо некоторое понимание когнитивных процессов у лю
дей и гипотезы о них. Одна из таких гипотез состоит в том, что образ действия,
который обычно предпринимают люди в подходе к ретроспективным задачам,
не использует их знания и умения делать выводы с наибольшим преимуще
ством. Создание противоположных свидетельств со всей очевидностью частич
но справляется с этой проблемой и помогает людям лучше использовать свое
мышление (Slovic & Fischhoff, 1977).
Однако, перед тем как подтвердить это заключение, необходимо обратиться
к целому ряду эмпирических вопросов: (а) какие дополнительные ш аги необ
ходимо сделать, чтобы ликвидировать это предубеждение, а не только умень
ш ить?; (б) будет ли работать эта процедура в менее ясно структурированных
задачах?; (в) будет ли достаточной практика процедуры в некоторых стандарт
ных задачах, чтобы изменить поведение в других задачах, где нет специфичес
ких инструкций? Процедура освобождения от предубеждения будет даже бо
лее проблемной, чем это есть, если она повысит веру людей в свои способности
выносить суждения больше, чем улучш ит сами эти способности.
Освобождение от предубеждения 493
Ч р езм ер н ая уверен н ость: П оп ы тки освобож д ен и я от п редубеж ден и я
“П ринятие решений в ситуациях неопределенности” подразумевает непол
ное знание. К ак результат этого, одним из основных компонентов принятия
таких реш ений является оценка качества любого знания, имеющегося в
наличии. Х отя статистические методы могут руководить этой оценкой, по
той или иной причине необходимо суждение, чтобы оценить уверенность,
которую можно вселить в чью-либо лучшую догадку о положении вещей.
Так к ак неправильная оценка уверенности может привести к плохим реш е
ниям, вы зы вая либо чрезмерную, либо недостаточную осторожность, то и в
дальнейш ем фокус исследования суждений состоит в идентификации ф ак
торов, влияю щ их на уверенность неподходящ им образом. Получение зна
ний по результатам — это один из таких факторов, поскольку он ведет к
тому, что люди преувеличиваю т полноту своих собственных знаний. Хотя
подозревают, что знания по результатам делают людей чрезмерно уверен
ными в своих знаниях, все ж е понятно, что люди подвержены некоторому
роду эндемической недостаточной уверенности, полезным противовесом
которой является ретроспективное предубеждение. Прояснение этой воз
можности требует исследовательской оценки абсолютной валидности суж
дений об уверенности.
Так к ак трудно оценить абсолютную валидность любого единичного суж
дения об уверенности, большинство исследований в этой области рассмат
ривали качество, или калибровку, набора суж дений, каж дое из которых
представляло собою субъективную вероятность, что утверж дение ф акта
является правильны м (Глава 22, этого издания). Д ля отлично калиброван
ного индивида оценки, скаж ем 0,70, ассоциируются с правильны ми утвер
ж дениями в течение 70% времени.
Ч резм ерная уверенность — гораздо более распространенное событие.
Типичное исследование может показы вать вероятность 0.75, чтобы ассоции
роваться только с 60% “попаданием”, и выражения определенности (р = 1,00),
правильны только в течение 80% времени. Когда люди оценивают, как много
они знаю т о значениях количеств, вы раж енны х численно (например, “Я
уверен на 0,98, что количество зарегистрированных избирателей-республи-
канцев в округе Лейн где-то между 12.000 и 30.000”), не будет необычным
обнаружить правдивые ответы, выпадаю щ ие из их 98-процентного интер
вала уверенности от 20% до 40% времени. Такие результаты беспокоят как
тех, кто должен полагаться на оценки уверенности, так и тех, кто обвинен
(прямо или косвенно) в преувеличении того, к ак много они знают. Полно
масштабное исследование, которое проводилось с целью опровергнуть, дис
кредитировать, поддержать или ограничить наличие чрезмерной уверенно
сти, охарактеризовано ниж е в перспективе попыток освобождения от пре
дубеждения. Значительную помощь в этом повторном анализе существую
щ их исследований оказало наличие нескольких исчерпываю щ их обзоров
литературы, хотя и осуществленных для несколько других целей. Они вклю
494 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
чаю т H enrion (1980), H ogart(1975), L ichtenstein, Fischhoff и P hillips (Глава
22), и W allsten и Budescu (1980). Этот повторный анализ был усложнен тем,
что многие из цитируемы х исследований проводились такж е и для некото
ры х других целей. И к ак результат этого, они не всегда точно подходили
под одну категорию освобождения от предубеждения. Это незначительное
несоответствие мож ет наклады вать ограничения на настоящ ую категори
альную схему (делая различия неясными) или н а исследования (смеш ивая
м анипуляции по освобождению от предубеждения).
Исследования, Исследования,
Стратегии рассматриваю рассматри
щие ретроспек вающие
тивное пре чрезмерную
дубеждение уверенность
Задачи с искажениями
Задачи с ложными условиями
Поднять ставки 4 1,30
Прояснить инструкции (стимулы) 6 3,10,13,14,21
Препятствовать ошибочному пониманию 11 13,21
13,14,20,22,23,
Использовать лучшие способы ответов 9 32,34,357,36,40
Задавать меньше вопросов 3,7,8,9 16
Неправильно понятые задачи
Демонстрировать альтернативную цель 3,4,6,8,9 14
Демонстрировать семантическое
несогласие 3,14,19,30
Демонстрировать невозможность задачи — 13
Демонстрировать обозреваемое различие 15
Ошибки экспертов
Способные к совершенствованию
Предупредить о проблеме — 13
Описать проблему 4 3
Обеспечить личную обратную связь — 21
1,2,4,17,21,26,
Экстенсивно тренировать 5? 27,31,34
Не поддающиеся коррекции
Заменить их _
Внести коррекцию в их ответы — 2,5,24
Осуществлять проект на основе ошибок — —
Освобождение от предубеждения 497
Продолжение табл. 2.
Ключ к исследованиям
Ошибки экспертов
Способные к совершенствованию. Если незначительно изменить интерпре
тационные полож ения, то последнее упоминавш ееся исследование в пре
дыдущем разделе может стать первым упоминающ имся в настоящ ем. Уве
рение испытуемых в том, что они могли допустить, чтобы каж ды й ответ был
просто догадкой, может рассматриваться к ак способ рассеивания какого бы
то ни было остаточного ошибочного понимания задачи или к ак ш аг в сторо
ну исправления испытуемых, которые понимают задачи, но не себя. Оно
несет подразумеваемое предостережение, что неспособность допустить до
500 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
гадки мож ет быть проблемой. Это предостережение было явны м в инструк
ции (Глава 21) испытуемым “разворачивать цепочки” своих субъективных
вероятностных распределений, чтобы избеж ать чрезмерной уверенности.
Отражает ли частичный успех этих манипуляций улучшение понимания или
чувствительность к распоряжениям, пока не ясно. Такая неясность может
объяснить малое количество исследований, принявш их эти подходы.
Это беспокойство о характеристиках требования исчезает в исследовани
ях намеренной тренировки, где “воздействия экспериментатора” составля
ют повестку дня. К ак показано в табл. 2, различные попытки тренировки
предпринимались с восхитительным успехом, хотя, может возникать беспо
койство, что недостаточный энтузиазм журналов отражать исследования с
негативными результатами мог уменьшить заметность неудач. Стремление
тренеров делать все возможное для получения эффекта сделало попытки тре
нировки достаточно сложными манипуляциями, чьи эффективные элемен
ты в некоторой степени неясны. Некоторыми из условий, изучение которых
более необходимо являю тся: получение обратной связи по большой выборке
ответов, получая информацию о конкретном выполнении задания (а не про
сто об общей проблеме), и наличие возможности обсуждения отношений меж
ду субъективным ощущением неопределенности и ответами о численной ве
роятности. К собственному удивлению, Лихтенш тейн и Фишхофф (1980b) об
наруж или, что один цикл тренировок с интенсивной, персонализированной
обратной связью был так ж е эффективен, как долгая серия проб. Неясно, в
какой степени эти различные успехи представляют тренировку, в узком смыс
ле овладения конкретной задачей (например, изучение распределения отве
тов, требуемых экспериментатором), или приобретение более общих умений.
Резюме
Оценка уверенности, полученная у различны х людей различны ми способа
ми, почти всегда демонстрировала значительную нечувствительность к сте
пени их знаний. Х отя все ж е не следует закры вать дверь перед методологи
ческими манипуляциям и, они оказались относительно неэффективными и
их результаты трудно обобщать. То, что они сделали, это показали, что чрез
мерная уверенность относительно сопротивляется многим формам исправ
ления (отличным от изменений в уровне сложности). Ключом к разработке
более сильны х и предсказываю щ их манипуляций могла бы быть значитель
но больш ая опора на психологическую теорию. Эффективность тренировки
калибровки наводит на мысль, что тщ ательный анализ того, какой уникаль
ный опыт обеспечивается таким и тренировками, а не профессиональным
обучением, мог бы к ак руководить освобождением от влияния, так и обога
тить психологическую теорию.
О бсуж дение
Предположив, что рассмотренные здесь исследования были охарактеризо
ваны точно, и что они исчерпывают (или, по крайней мере, достаточно пред
ставляю т) совокупность соответствующ их исследований, тогда их общее
сообщение окаж ется довольно успокаиваю щ им для когнитивного психоло
га. Оба предубеждения оказались умеренно устойчивыми, сопротивляясь
попыткам интерпретировать их к ак артефакты и ликвидировать их “меха
ническими” манипуляциям и, таким и как принуждение испытуемых рабо
тать усерднее. Эффективное освобождение от предубеждения обычно вов
лекало изменение психологической природы задачи (и подхода испытуемых
504 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
к ней). В таких случаях, по крайней мере, некоторой чести заслуж ивает
психологическая теория. Н апример, гипотеза о том, к ак люди восстанавли
вают информацию из пам яти, прежде чем оценить уверенность, руководи
ла м анипуляцией K oriat и других (1980) этого восстановительного процес
са. Д аж е тренировочная программа “забрасывания испытуемого всем” была
основана на хорошо проверенных и общеприменимых принципах обучения.
Это излож ение следует сопровождать несколькими концептуальны ми
протестами (в дополнение к методологическим, которыми оно открылось).
Одно состоит в том, что различие между артефактной и методологической
м анипуляциям и может быть менее ясным, чем было сказано здесь. Н апри
мер, увещ евание людей работать старательнее было бы артефактной мани
пуляцией, если бы оно коренилось в утверж дении, что более непреднаме
ренные инструкции не вызываю т “реального поведения”. Однако если бы
исследователь мог выдвинуть основательную гипотезу о том, к ак различ
ны е инструкции воздействуют на процессы суж дений, артеф акт стал бы
главны м следствием с отдельными предсказаниями реального поведения в
ситуациях с и без определенных увещ еваний.
Второй концептуальны й протест состоит в том, что, когда мы подвергаем
сомнению реальность предубеждений, это может налож ить ограничения и
сделать непродуктивным психологическое исследование. В продолжение
примера из предыдущего абзаца, в ж изни есть к ак несерьезные ситуации,
так и ситуации, где следует работать усердно; внутренне ни одна из них не
реальнее, чем другая. Кроме того, относительная валидность несерьезных
и “усердны х” ситуаций в лабораторных экспериментах зависит от ситуа
ций реального м ира, на которые долж ны экстраполироваться их результа
ты . У каж дой есть свое место. Понимание соответствия лаборатория-мир
требует хорошего суж дения для характеристики обоих контекстов. Н апри
мер, ситуации с усердной работой не обязательно синонимичны важ ны м си
туациям . Люди могут не работать усердно по важным проблемам до тех пор,
пока не осознают к ак центральность суж дений по результатам проблемы,
так и потенциальную ошибочность этого суж дения.
И спользование исследований по освобождению от предубеждения для
того, чтобы откры ть пограничные условия наблю дения предубеждений,
ведет к третьему концептуальному протесту. В этом обзоре итоговые табли
цы косвенным образом приписали равны й вес различны м исследованиям,
точно определенны м, возмож но, некоторы м понятием окончательности
каж дого исследования (компетентностью, экстенсивностью и т.д.). Такое
совпадение статистически значимы х и статистически незначимых резуль
татов является сомнительной процедурой, будучи построенной только лиш ь
на методологической основе (например, Hedges & OBcin, 1980). Она стано
вится концептуально сомнительной, когда начинаеш ь сомневаться относи
тельно того, адекватно ли сделана вы борка возможных исследований. В та
к и х случаях собранные данные составляю т концептуально зависимое на
блюдение, и им не нужно присваивать равны й вес. Любое излож ение того,
Освобождение от предубеждения 505
как ведут себя люди, нуждается в тщ ательном определении подмира пове
денческих ситуаций, по которым будет производиться выборка исследова
ний. Н апример, некоторые критики обвиняли ранние исследования эври
стики суж дений в том, что они “искали неприятностей” в смысле поиска
(вы хваты вания) ситуаций, в которых люди вели бы себя ошибочным обра
зом. Если это утверждение правильно, тогда не нужно интерпретировать
каждую демонстрацию поведения, подверженного предубеждению, к ак бой
котирование общей способности людей к суждениям; его уместность огра
ничена к такому роду ситуаций, какие изучались (или чрезмерно изучались)
в тех экспериментах. Ф окусируясь на пограничны х условиях для оценива
ния предубеждений, большинство современных исследований подвержено
собственному предубеждению выборки, которое необходимо рассмотреть в
ходе обобщения их результатов.
Таблица 3. Мир рассуждений о предубеждениях и попытках освобождения
от предубеждений.
Д альнейш ие вопросы
Вопрос, возникнут ли подобные модели по другим видам предубеждений,
требует обзора аналогичной литературы . Таблица 3 предлагает характерис
тику сферы предубеждений, внутри которой могут разы скиваться повторя
ю щ иеся модели, отличая содержание этого издания от других предубежде
ний, причинявш их беспокойство психологам.
Затягиваю щ ийся мета-вопрос, обращ енный к таким обзорам, это: Н а
сколько хорош и люди? Я вляю тся ли они когнитивны ми калекам и или зна
токами? Чтобы дать один ответ, необходимо ответить на невесомые вопро
сы о природе ж изни и общем сходстве ж изненного опыта людей с лабора
торными условиями. У клончивый момент настоящ его обзора состоит в том,
что резервуар умений по вынесению суждений у людей к ак наполовину пуст,
так и наполовину полон. Люди достаточно умелы, чтобы прож ить, доста
точно неумелы, чтобы соверш ать предсказуемые и последовательные ошиб
ки ; они достаточно умны , чтобы изобрести ш ироко и легко применимую
эвристику, которая часто хорошо им служ ит, достаточно неискуш енны ,
чтобы не осознать пределов такой эвристики. Более специф ическая оценка
способности людей может быть дана только в контексте конкретной задачи
по вынесению суж дения. Такие общие утверж дения (или отговорки) о “лю
д ях ” отраж аю т общую черту исследований суждений — отсутствие интере
са к индивидуальным различиям . Х отя это предпочтение групповых резуль
татов мож ет быть просто делом вкуса, оно может быть оправдано теорети
чески утверж дением, что главны е результаты в исследованиях суждений
так обш ирны и использую тся так неадекватно, что индивидуальные разли
ч и я могут подож дать. Некоторую эмпирическую поддержку этого утверж
дения обеспечивает довольно скудное понимание, являю щ ееся результатом
исследования групп с известными характеристиками. Особенно поразитель
ным было отсутствие различий в экспериментальны х исследованиях наи
более логичны х из известны х групп — эксперты , выносящ ие суж дения в
своих областях экспертиз. Случайные и полученные в ходе изучения про
блемы свидетельства, собранные Dawes (1976), Eddy (Глава 18, этого изда
н ия), F isher (1970) и другими, такж е показы ваю т, что экстенсивная трени
ровка и вы сокие ставки — не гарантия успехов в суж дениях. Тем не менее,
необходимо дальнейш ее исследование, к ак из-за твердости, с которой мно
гие уверены, что эксперты лучш е, так и из-за прикладного значения исполь
зования экспертного суж дения с большим преимущ еством.
Д ля непосредственной практической цели наилучш его использования
экспертов так, чтобы избеж ать предубеждения, достаточно знать, лучш е ли
они, чем непрофессионалы, или, по крайней мере, лучш е ли осознают свои
ограничения в суж дениях. Д ля окончательной практической цели освобож
Освобождение от предубеждения 507
дения всех судей от предубеждений очень важ но знать, к ак эксперты оказа
лись на том этапе, где оказались, или почему они не пош ли дальш е. Далее
следует перечень условий, которые обычно сопровождают изучение. Д ля
каждого показаны способы, при которы х эксперты могут быть в особенно
выгодном или невыгодном полож ении, в зависимости от обстоятельств:
Р и ч а р д Н и с б е т т , Д э в и д К р а н ц , К ри ст оф ер
Д ж еп сон и Д ж еф ф ри Т. Ф онг
* Написание этой статьи и некоторые из исследований, о которых в ней идет речь, были
частично поддержаны грантом BNS 79-14094 Национального фонда науки. Мы благода
рим Ли Росса, Сауля Ш тернберга и Поля Тагада за комментарии к более раннему варианту
статьи.
Улучшение индуктивного вывода 509
бота в этом русле продолжается, становится все более ясно, что может быть
очень сложно точно знать, к акая модель для событий является правильной
и, таким образом, знать, для чего требуются процедуры вывода.
2. Д аж е если можно быть достаточно уверенным, что произош ла ошиб
ка, очень не просто узнать, как она произош ла. Трудно узнать, относится
ли ош ибка насчет ошибочного рассуж дения, то есть, скудны х процедур
вывода, или насчет неправильны х моделей, то есть, неверных предш еству
ющих убеждений о природе рассматриваемых событий.
3. Д аж е если мы достаточно уверены в соответствующих моделях, у нас
может не бы ть очевидных полезны х руководств по выводу. В настоящ ее
время мы не имеем представления о том, к ак перевести некоторые из наибо
лее фундаментальных статистических размыш лений в руководство по рас
суждениям в повседневной ж изни. Это выступает особенно явно в примере
размыш лений о предубеждении выборки. Люди склонны уделять слиш ком
мало внимания возможности того, что свидетельство подверглось предубеж
дению, но еще далеко до понимания того, к ак ая “статистическая эвристи
ка” будет соответствующей для использования в большинстве проблем ре
ального мира.
М одели и э в р и с т и к а в и н д у к ти в н о м р ассу ж д ен и и
Давайте начнем наш е обсуждение ошибочного индуктивного рассуждения с
анализа примера, в котором отсутствуют сложности, на которые мы только
что ссылались. Многие из примеров в этой книге подошли бы, но проблема
родильного отделения в работе Канемана и Тверски (1972,3) особенно точна
и поможет нам установить некоторые определения. Испытуемых попросили
составить мнение о том, в большой или в маленькой больнице будет большее
число дней в году, когда более 60■> новорожденных будут мальчиками. Боль
шинство испытуемых отметило “примерно одинаковое”, из оставш ихся око
ло половины отметили “в большой” и около половины - “в маленькой”. Дру
гими словами, к ак группа, испытуемые были уверены, что подобные откло
няющ иеся дни, когда рождение мальчиков превысит 60% , будут в равной
степени вероятны как в большой, так и в маленькой больнице.
Канеман и Тверски предположили на основе этого и многих других экс
периментов, что преобладающий способ рассуж дения, ведущ ий к этому ре
зультату, — это использование эвристики репрезентативности. И спыту
емые, использующ ие эту эвристику, будут фокусироваться на различии от
клоняющ егося результата (60% ) от предполагаемого типичного исхода (око
ло 50% для этого случая). Поскольку на степень сходства, или “репрезента
тивность”, не влияет размер больницы, испытуемые будут считать вероят
ность отклоняю щ егося результата одинаковой для обеих больниц.
Однако, при правильном подходе к этой проблеме, мы обращаемся к дей
ствительным подгруппам “муж ских” и “ж енских” исходов в любой из дней в
одной больнице, как к случайной выборке из совокупности 50 - 50. Затем
510 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
следует, из биноминальной формулы или закона больших чисел, что откло
няющ ийся процент выборки менее вероятен при большем размере выборки. Зак
лючаем, исходя из применения вероятностной модели, что д ни, когда рождает
ся 60 или более процентов мальчиков менее вероятны в большой больнице.
В этом примере рассуждение, основывающееся на интуитивной эврис
тике (эвристике репрезентативности), противопоставлено рассуж дениям,
осущ ествляю щ имся внутри математической модели. Мы выносим норма
тивное суж дение, кри ти куя интуитивное суж дение к ак ошибочное, по
скольку было получено отличное от него заклю чение по модели, которая,
к а к мы уверены , является подходящ ей репрезентацией для пола новорож
денны х. Н аш а процедура по вынесению нормативного суж дения на основе
модели иллю стрирует основной принцип: Индуктивное размышление дол
жно быть оправдано в терминах уместности основных моделей рассмат
риваемых событий.
М атематическая модель — лиш ь один вид модели, притом редко исполь
зуемый в разм ы ш лениях людей: она требует математической тренировки и
огромного количества времени для размы ш лений. Но мы будем использо
вать термин модель в отношении любой частичной репрезентации некото
ры х аспектов действительности. Мы вклю чаем сюда ф изические модели
(например, модель самолета, сделанная в масш табе), математические моде
ли (например, уравнения, описываю щ ие воздушную струю над кры льям и
самолета) и, более обобщенно, интуитивные концептуальны е модели. Это
есть умственные репрезентации людей о самолетах, или воздушной струе,
или процессах, определяю щ их пол новорожденных, или о любых других
аспектах действительности. Предельно важ ное различие среди моделей ле
ж и т меж ду теми, которые являю тся чисто детерминистскими (то есть, они
не содерж ат репрезентации непредсказуемости), и теми, которые являю тся
вероятностными (то есть, они вклю чаю т предположение, что события не
достаточно предсказуемы , учиты вая стандартные условия информации).
Вероятностные модели могут быть физическими (выбрасывание игральны х
костей или вы тягивание камуш ков из урны) или математическими (слу
чайны е переменные), но часто они менее точны. Н апример, человек, наблю
даю щ ий пры ж ки в длину может быть убежден, что следующий участник
соревнования пры гнет где-то на 8 метров, но пры ж ок короче или длиннее
не будет удивительны м, и пры ж ок даж е на 7,5 или 8,5 метров будет такж е
возмож ны м. Эта умственная репрезентация о пры ж ках в длину является
интуитивной вероятностной моделью, вклю чаю щ ей умственное “типичное
расстояние” и , своего рода, “ошибочное распределение”, которое дает откло
нения от типичного.
Природа модели событий имеет критическое значение для отбора исполь
зую щ ихся инструментов вывода, вклю чаю щ их разнообразную эвристики.
Эвристика — это любой руководящ ий принцип трансформирования инфор
мации с целью реш ения проблемы или формирования суж дения. Мы уж е
упоминали эвристику репрезентативности, но н а самом деле она вклю чает
Улучшение индуктивного вывода 511
два различны х вида эвристики: один для построения моделей (согласно эв
ристике репрезентативности, основная модель долж на близко соответство
вать структурным особенностям наблюдаемых данны х), а другой для оце
нивания вероятности исходов (исход более вероятен, если его структура бо
лее сходна со структурой предполагаемой основной модели). Статисти
ческая эвристика поощ ряет дум ать об инф орм ации в терм инах таки х
свойств данны х, к ак надежность и валидность, и манипулировать инфор
мацией, используя вероятностные концепции, такие как базовое значение.
Если имеется основная вероятностная модель для событий особого типа, то,
вероятно, при рассуждении об этих событиях будет использоваться статис
тическая эвристика.
Давайте определимся, к ак применяю тся эти концепции моделей и эври
стики в проблеме родильного отделения. Д ля полностью удовлетворитель
ного реш ения этой проблемы использовалась бы м атематическая модель —
модель случайной выборки из совокупности 50 - 50. Больш инство испыту
емых, возможно, используют слиш ком простую модель пола новорожден
ных — модель, которая определяет разделение 50 -5 0 , но не вклю чает ника
ких отнош ений между случайностью процессов осущ ествления выборки и
возможной ош ибкой этого осущ ествления. Несомненно, большинство ис
пытуемых знаю т что-то об отнош ениях между размером выборки и ош и
бочностью осущ ествления выборки, но это знание не включено в интуитив
ную модель, которую они умственно установили, чтобы реш ить проблему.
Вместо этого они дополнили простую модель 50 - 50 репрезентативной эв
ристикой, которая привела их к заклю чению , что 60% рождений м альчи
ков в какой-то степени маловероятно, но в равной степени для обеих боль
ниц. Заметим, что испытуемым не нужно быть статистикам и, чтобы реш ить
эту проблему, по крайней мере, качественным способом. Если их модель
наблюдаемого отнош ения полов вклю чала интуитивное понятие осуществ
ления выборки, то они могли бы использовать статистическую эвристику.
В этом случае, необходимой эвристикой будет понятие, что большие выбор
ки с больш ей вероятностью будут иметь репрезентативную или типичную
структуру, чем маленькие выборки.
В кратце, размы ш ление основано на моделях. В зависимости от своей
модели человек мож ет использовать различны е алгоритмы эвристики. Ма
тематики могут выводить количественные следствия на основе математи
ческих моделей; люди с интуитивной моделью осущ ествления выборки мо
гут успешно использовать статистическую эвристику; а люди со слиш ком
простыми моделями могут использовать репрезентативную эвристику и, по
крайней мере, в этой проблеме, будут вводиться ею в заблуждение.
П р и м ен ен и е в е р о я тн о стн ы х м о д ел ей в п о в сед н ев н ы х в ы в о д ах
Н еудача использования вероятностной и статистической эвристики стано
вится причиной ошибок не только в ответе на загадки типа проблемы ро
512 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
дильного отделения; она такж е влияет на выводы людей в повседневных
ситуациях, особенно в социальной сфере. Росс (Ross, 1977) предположил,
что люди совершают фундаментальную ошибку атрибуции: они склонны
приписы вать поведение других людей личным наклонностям, не замечая
ситуативны х причин или временных внеш них влияний на поведение. Мы
дадим два примера этой ош ибки и покаж ем, к ак рассмотрение вероятност
ны х моделей помогает нам определять такой тип ошибок.
Нисбетт и Боргида (N isbett и B orgida, 1975) показали, что испытуемые
часто неспособны использовать информацию “консенсуса”: они подразуме
вают идиосинкразические, личны е наклонности для поведения конкретно
го индивида, даж е если их проинформировали, что больший <гео других
людей в подобной ситуации вели себя сходным образом. Н апример, в одном
исследовании испытуемые оценивали “Грега Р .” как равнодуш ного и ж ес
токого человека, потому что он не приш ел н а помощь “ж ертве”, у которой,
к ак он был уверен, был приступ. Тенденция давать “Грегу Р .” такие нега
тивны е оценки была высокой к а к у испытуемых, которым дали информа
цию консенсуса, а именно, что большинство людей в идентичной ситуации
не оказали помощи ж ертве, так и у испытуемых контрольной группы, ко
торым не давалась подобная инф ормация консенсуса, и которые, таким об
разом, были уверены, что большинство людей помогли бы ж ертве.
К ак люди могут выгодно использовать информацию консенсуса, чтобы
см ягчить свои выводы о личны х чертах или склонностях? Нам каж ется,
что некоторы е социальные психологи, которые все ж е делаю т акцент на
ситуационны х детерминантах поведения, оперируют при помощи интуи
тивной (а порой даж е формальной) вероятностной модели, в которой неко
торые ситуации ведут к высокой вероятности определенного поведения по
чти для всех индивидов, тогда как некоторы е индивиды могут обладать
высокой вероятностью о п р е д е л е н н о е поведения почти во всех ситуациях.
По структуре, предлагаемой подобной моделью, инф ормация консенсуса
легко интерпретируется к ак свидетельство того, что конкретная ситуация
бы ла высоко вероятной, и , следовательно, возникновение подобного пове
дения не является хорошим свидетельством того, что данный индивид об
ладает высокой вероятностью такого поведения в других ситуациях.
Мы считаем, что вероятностные модели такого типа являю тся хорошей реп
резентацией социального поведения, и они обеспечивают основание для кри
тики выводов, которые не использовали выгодно информацию консенсуса.
Испытуемые в исследовании Нисбетта и Боргиды, возможно, полагались ис
ключительно на репрезентативную эвристику, конструируя модель целевого
человека, который будет соответствовать данным: Грег Р. жестокий и равно
душ ный, потому что его действия каж утся жестокими и р -внодушными.
В этом примере, к ак и в случае с проблемой родильного отделения нет
слиш ком большого соблазна защ ищ ать выводы испытуемых. Ч истая мо
дель черт социального поведения, без какого бы то ни было ситуационного
влияни я на вероятность, не является очень разумной, и сами испытуемые,
Улучшение индуктивного вывода 513
наиболее вероятно, допустили бы то ж е самое. Наш второй пример того, чего
мы могли бы придерж иваться, в качестве случая фундаментальной ошиб
ки атрибуции, однако, ведет даж е к большим спорам.
П редположим, что кандидату н а значительную административную дол
ж ность предлож или встречу н а основании очень хорошей рекомендации
предыдущ их работодателей. Встреча началась с группового ланча, во вре
м я которого кандидат демонстрировал нервное поведение. Позднее некото
рые из присутствовавш их н а ланче людей сказали, что кандидату недостает
необходимых для работы межличностных умений.
Социальный психолог мог бы сказать, что вывод работодателей о “м еж
личностных ум ениях” сомнителен. Ситуативное объяснение наруш аю щ е
го правила поведения (вклю чая требования обстановки ланча-встречи) или
вероятностная интерпретация (он вел себя не так, к ак обычно) могли бы быть
правдоподобными, и, в самом деле, в свете рекомендаций предыдущих ра
ботодателей каж утся более правдоподобными, чем объяснение в терминах
умений кандидата. Но работодатель мог бы ответить, что каж ды й, кто не в
состоянии демонстрировать равновесие в ситуации ланча-встречи, тот ве
роятно, потерпит неудачу в других ситуациях, связанны х с работой, кото
рые в равной степени требуют равновесия.
Очень сложно опровергнуть этот довод. Работодатели оправдали свой
вывод в терминах модели, которая постулирует высокую статистическую
ассоциацию между неудачей в одной ситуации и неудачей в других ситуа
ц иях, сходных с первой по некоторым переменным, хотя по другим - нет.
Трудно узнать, вовлекал ли действительный когнитивны й механизм, ле
ж ащ ий в основе первоначального вывода, использование подобной модели
или вместо этого просто полагался на эвристику репрезентативности (рас
сматривая сходство между поведением кандидата во время ланча и прото-
типным поведением во время ланча стереотипного идеального кандидата).
И такж е трудно знать наверняка, что предложенная работодателями модель
неверна. Социальный психолог знает по опыту, что подобная корреляция
обычно очень слаба при эмпирической проверке; но эта конкретная корре
л яц и я не проверялась непосредственно, и чтобы проверить ее, применив
сущ ествую щ ие психологические техники, потребовалось бы невероятно
подробное и недопустимо дорогое исследование.
Эти примеры иллю стрирую т два различны х способа, когда индуктивное
размы ш ление мож ет быть ошибочным, и они указы ваю т на два различны х
вида нормативных советов или обучения, которые могут потребоваться, (а)
Иногда процедуры вывода ошибочны. Иногда люди могут соглаш аться (по
крайней мере, после размы ш ления) с тем, к ак ая модель приемлема, но на
практике могут использовать другие, более простые модели и , соответствен
но, легкую эвристику. Нормативный совет делает акцент на избегании чрез
мерного упрощ ения и слиш ком легкого использования эвристики репрезен
тативности. Ц ели обучения вклю чаю т обучение моделям обширной полез
ности, таким к ак биномиальная модель осущ ествления выборки, обучение
514 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
конкретному применению этих моделей, и подчеркивание статистической
эвристики, которая мож ет иногда зам енять строгое дедуктивное рассужде
ние в моделях, (б) Иногда рассуждение по данной модели правильно, но сама
модель сомнительна или даж е демонстративно неправильна. Нормативный
совет подчеркивает, что известно (например, о слабости определенных ти
пов поведенческих корреляций), что может делать конкретную модель пред
почтительнее.
Этот анализ такж е указы вает на два очень серьезных пробела в доступнос
ти нормативного совета. В некоторых случаях у нас могут отсутствовать зна
ния, необходимые для формулирования адекватных моделей. В других слу
чаях, у нас может не быть достаточно легкой и подходящей статистической
эвристики. Образец информации консенсуса иллюстрирует пробелы в совре
менных проблемах социальной науки. Мы можем критиковать испытуемых,
которые не использовали информацию консенсуса вообще, но предполагаем,
что испытуемые ответят: “Да, вы правы , ситуативные факторы являю тся
релевантными; а теперь скаж ите нам, насколько мы должны исправить наш е
убеждение о равнодуш ии Грега Р. с точки зрения того ф акта, что большин
ство людей вели себя подобным образом?” Чтобы ответить на это, необходима
была бы теория взаимодействия черт / ситуаций, которую специалисты по
психологии личности и социальные психологи до сих пор не дали.
Д емонстрация того ф акта, что у нас нет определенной существенной ста
тистической эвристики, требует своего раздела.
Выбор колледж а
Дэвид Л. был старшеклассником в школе на Восточном побережье, который планиро
вал поступить в колледж. Он имел отличные оценки в школе, и у него была возмож
ность выбора из двух наилучших альтернатив: небольшой колледж свободных искусств
и Ivy League University. Оба заведения имели почти равный престиж и равную оплату
за обучение. Оба находились в привлекательных городах Восточного побережья на при
близительно равном расстоянии от его родного города. У Дэвида было несколько стар
ших друзей, посещающих колледж свободных искусств, и несколько друзей, посеща
ющих Ivy League University. Все они были отличными студентами, как и он, и имели
сходные с ним интересы. Все его друзья из колледжа свободных искусств сообщили,
что им нравится это место, и что они находят его очень стимулирующим. Друзья из Ivy
League University сообщили, что у них много жалоб как на личной и социальной осно
ве, так и на образовательной основе. Дэвид первоначально думал, что он пойдет в кол
ледж свободных искусств. Однако он решил сделать однодневные визиты в оба заведе
ния лично. Ему не понравилось то, что он увидел в частном колледже свободных ис
кусств: несколько людей, которых он встретил, показались ему холодными и неприят
ными; профессор, с которым он имел краткую встречу, показался резким и незаинте
ресованным в нем; и ему не понравилось “ощущение” университетского городка. Ему
понравилось то, что он увидел в Ivy League University: несколько людей, которых он
встретил, показались ему живыми, энтузиастами, приятными в общении; он встретил
ся с двумя различными профессорами, которые проявили к нему личный интерес; и он
ушел с приятным ощущением университетского городка.
Какое заведение выберет Дэвид Л. и почему? Постарайтесь проанализировать доводы с
обеих сторон и объяснить, какая сторона сильнее.
Улучшение индуктивного вывода 523
Это особенно трудная проблема, потому что она содержит два различны х
вероятностных компонента: (а) довод основного значения, относящ ийся к
маловероятному результату, что Дэвид Л . будет действовать на основе хвос
та распределения (на основе текущ их реакций своих друзей он может пред
положить, что модальный ответ по колледж у свободных искусств очень бла
гоприятен, и что вариативность низка), и (б) довод размера/предубеж дения
выборки, касаю щ ийся адекватности его однодневного разоблачения. Мы
предполагаем, на основе опытного исследования, что каж ды й из этих веро
ятностных компонентов блокирован обычным набором убеждений. А имен
но, что профиль предпочтений и антипатий индивида уникален и предска
зуем только на основе опы та и личности этого индивида. Ощ ущ ения инди
вида, насколько таинственными они ни были бы в своем происхождении,
являю тся, по крайней мере, надеж ны ми, с небольшим количеством инфор
мации о том, является ли объект достаточным для создания списка плюсов
и минусов, которы й обеспечивает уверенное руководство для будущих ре
акций. Больш инство незаконченных ответов по этой проблеме отраж али эти
убеждения (например, “он должен реш ать сам, а не его друзья”). Но не все
ответы таковы . Вот один ответ вы пускника, у которого не было курсовых
работ по вероятности или статистике:
Я бы сказал, что он пойдет в колледж свободных искусств. Его негативный опыт был
лишь кратким, очень поверхностным контактом с заведением. Его друзья, все истинные
клоны его самого, были там (предположительно) некоторое время и знают место близко,
и оно им нравится, тогда как для Университета правдивы обратные утверждения. Одна
ко он будет оправдан, если будет иметь собственные впечатления об этих местах. Часто
эта интуиция является высшим восприятием, которое мы не можем анализировать, и он
будет прав, следуя ему. Хотя, я думаю, что первый упомянутый мной выбор более наде
жен, так как его опыт знакомства с двумя заведениями очень ограничен.
*Это пересмотренная версия статьи, которая первоначально появилась в книге под редак
цией R. Schwing и W. А. Albers Jr. Оценка риска общества: Насколько безопасность дос
таточно безопасна? New York: Plenum Press, 1980. Авторские права © 1980 имеет Plenum
Press. Печатается в соответствии с разрешением. Поддержка этой работы была обеспечена
Программой оценки технологий и анализа риска фонда Национальной науки по Гранту
PRA79-11934 Университету Кларка согласно субдоговору с Perceptronics, Inc.
530 ВОСПРИЯТИЕ РИСКА
Эта глава исследует некоторые психологические элементы процесса оцен
ки риска. Ее основные предпосылки в том, что к ак общество, так и экспер
ты являю тся необходимыми участниками этого процесса, что оценка внут
ренне субъективна, и что понимание ограничений суж дения является ре
ш аю щ им в процессе принятия реш ений.
П р е д у б е ж д е н и я в с у ж д ен и ях п р и в о с п р и я ти и р и с к а
Когда непрофессионалов просят оценить виды риска, у них редко имеются
под рукой статистические данные. В большинстве случаев они должны де
лать выводы, основываясь на том, что они помнят из услыш анного и наблю
давш егося о рассматриваемом виде риска. Психологическое исследование,
больш ая часть которого была описана в этой книге ранее, идентифицирова
Факты против страха... 531
Дост упност ь
Одна из эвристик, которая имеет особую релевантность для восприятия рис
ка, назы вается доступность (Tversky & K ahnem an, 1973,11). Люди, исполь
зующие эту эвристику, судят о событии к ак о вероятном или частом, если
его примеры можно легко представить или вспомнить. Так к ак часто проис
ходящ ие события обычно легче представить или вспомнить, чем редко про
исходящ ие события, доступность часто является подходящ им признаком.
Однако на доступность оказы ваю т влияние многочисленные факторы , не
связанные с частотой происхождения события. Например, недавнее бедствие
или ярки й фильм, такой к ак “ Челюсти” или “Китайский синдром”, могли
бы серьезно исказить суждения о риске.
Предубеждение доступности помогает объяснить неправильное воспри
ятие людей и ошибочные реш ения в отношении определенных естествен
ных видов риска. Н апример, обсуждая ж ителей затопляемы х территорий,
Кейтс (K ates, 1962) писал:
Главное ограничение способности людей использовать улучшенную информацию о рис
ке наводнения - это то, что в основном они полагаются на опыт. Люди в затопляемых
территориях оказываются в большой степени пленниками своего опыта... Недавние
наводнения, кажется, устанавливают стремящиеся вверх границы размеров потерь, о
которых, по убеждениям менеджеров, люди могли бы побеспокоиться заранее, (с. 140)
Н орм а по Сообщае
Оценки мые Случаи, Статьи
2,05*10*
Причина смерт и испы т у смерт и
респонден
ем ы х
тов США R-G S-T R-G S-T R-G S-T
Оспа 0 57 0 0 0 0 0 0
Отравление витаминами 1 102 0 0 0 0 0 0
Ботулизм 2 183 0 0 0 0 0 0
Корь 5 168 0 0 0 0 0 0
Фейерверк 6 160 0 0 0 0 0 0
Прививка от оспы 8 23 0 0 0 0 0 0
Коклюш 15 93 0 0 0 0 0 0
Полиомиелит 17 97 0 0 0 0 0 0
Ядовитый укус
животного или 48 350 0 0 0 0 0 0
насекомого
536 ВОСПРИЯТИЕ РИСКА
Продолжение табл. 2
Торнадо 90 564 36 25 10 6 14 7
Молния 107 91 1 0 1 0 1 0
Неядовитое животное 129 174 4 2 4 2 4 2
Наводнение 205 736 4 10 2 2 2 2
Чрезмерное
334 314 0 0 0 0 0 0
переохлаждение
Сифилис 410 492 0 0 0 0 0 0
Беременность, роды,
аборт 451 1,344 0 0 0 0 0 0
Инфекционный гепатит 677 545 0 0 0 0 0 0
Аппендицит 902 605 0 0 0 0 0 0
Удар электрическим 5 0 5 0 6
током 1.025 766 0
Столкновение 0 1 0 1 0
1.517 689 1
поездов/автомобилей
Астма 1.886 506 1 0 1 0 1 0
Несчастный случай с 1.345 8 1 8 1 9 1
огнестрельным оружием 2.255
Отравление
твердым/жидким 2.563 1.013 3 3 1 1 1 1
веществом
Туберкулез 3.690 658 0 0 0 0 0 0
Пожары и возгорания 7.380 3.336 94 46 33 9 38 10
Случаи гибели на воде 7.380 1.648 47 60 44 24 45 37
Лейкемия 14.555 2.496 1 0 1 0 1 0
Случайное падение 17.425 2.675 15 7 15 6 16 9
Убийство 18.860 5.582 278 208 167 122 329 199
Эмфизема 21.730 2.848 1 0 1 0 1 0
Суицид 24.600 4.679 29 19 28 18 36 20
Рак груди 31.160 2.964 0 0 0 0 0 0
Диабет 38.950 1.476 0 1 0 1 0 1
Автомобильная авария 55.350 41.161 298 83 245 69 180 73
Рак легких 75.850 9.764 3 2 3 2 4 2
Рак желудка 95.120 3.283 0 1 0 1 0 1
Все несчастные случаи 112.750 88.879 715 596 421 152 374 177
Инсульт 209.100 7.109 12 4 12 4 13 4
Все формы рака 328.000 45.609 25 12 25 12 26 15
Болезнь сердца 738.000 23.599 49 30 45 25 46 25
Факты против страха... 537
Продолжение табл. 2
Все болезни 1.740.450 88.838 111 87 100 76 104 78
Общее количество
репортажей (причины
10, 11, 13, 29, 31, 37 1.174 945 729 376 860 483
и 41)
БЬрреляции (R-G
против S-T)_________ г = 0.97 г = 0.94 г = 0.98
Если лю ди, которы е видели сокращ енные деревья, были долж ны м обра
зом чувствительны к тому, что упущено, доля проблем, которые они отнес
ли к “другим проблемам”, уравняет сумму долей проблем, отнесенных к со
кращ енны м ветвям и к “другим проблемам” теми, кто видел полное дерево.
Результаты в Таблице 3 показываю т: что было вне поля зрения, было вне
рассуж дений. Н апример, в сокращ енном дереве группы 1 “другие пробле
м ы ” долж ны были увеличиться в ш есть раз (от 0.078 до 0.468), чтобы отра
зить долю наруш ений из-за проблем запуска, заж игания и злонамеренных
действий, которы е были упущ ены в диаграмме. Вместо этого, “другие про
блемы” были только удвоены, тогда к ак значение трех упомянуты х систем
было сущ ественно увеличено. Второе исследование не только повторило эти
результаты , но и показало, что люди, рассматривавш ие сокращ енные дере
вья, судили о неудаче пуска (по всем причинам), к ак менее вероятной, чем
это делали те, кто наблю дал несокращ енное дерево.
Факты против страха... 539
>н
§
1М
2
К
ф
аи cd
ft
0
g н
IS 1
1 1
К § s£
IS
® й «S
*5 § К со Я
540 ВОСПРИЯТИЕ РИСКА
«
ев
Факты против страха... 541
542 ВОСПРИЯТИЕ РИСКА
1 s и S
I ьЯ S
д 1Л gi
*
| 1 1 |
g, s s I
2 » й ‘
§4 §
s 5 -
§ I 6"
я Л £
§ В. « 8 * g
&I i * g I
I « Я 8 11
“ «§ * I g l
8 ä % ° -I
I B l H «
III Iff
i J a PQ H 5
&g I g “
|5 g 8 g l
i i a111
SUMS
« a
S3 9 1
S x§
в о
W W w ^ S3
о“• § 1
—1^ 1
*Р 3 S S- H-
ОРч s §5
i-i ei ео ° r
ф 2
£
а п
8.3 х 3
g з
м
3
О
59 1 IВ
Факты против страха... 543
Вопросы на
Летальные события общие темы
Соотвую- Эксперимент 1ь Эксперимент 2Ь Эксперимент Зь
щий
Шансы Пра Пра Пра
правиль
ный %а % виль % виль % виль
N N N N ный
N ный N ный
% % %
1:1 50 644 9 53 339 8 54 861 19 53
1,5:1 60 68 1 57 108 2,5 59 210 5 56
2:1 67 575 8 64 434 10 65 455 1 63
3:1 75 189 2 71 252 6 65 157 3,5 76
5:1 83 250 4 70 322 8 71 194 4 76
10:1 91 1 167 17 66 390 9 76 376 8 74
20:1 95 126 2 72 163 4 81 66 1,6 85
50:1 98 258 4 68 227 5 74 69 1,5 83
100:1 99 1 180 17 73 319 8 87 376 8 80
1.000:1 99,9 862 13 81 219 5 84 334 7 88
10.000:1 100 459 7 87 138 3 92 263 6 89
100.000:1 100 163 2 85 23 0,5 96 134 3 92
1.000.000:1 100 157 2 90 47 1 96 360 8 94
Итого 6.098 88 2.981 70 3.855 75
Общий правильный 71.0 72.5 73.1
%
Факты против страха... 545
Примечание: % N относится к процентному отношению суждений о ш ан
сах, которые попали в каждую основную категорию. В эксперименте 1 было
66 испытуемых, в Эксперименте 2 - 40 и в Эксперименте 3 - 4 2 .
аДля хорошо калиброванных испытуемых
ьЭксперименты 1, 2 и 3 были обозначены Эксперименты 2, 3 и 4 в первона
чальном отчете.
Источник : Fischoff, Slovic & Lichtenstein (1977)
3. Передо мною мешочек с фишками для покера. В нем 100 белых фишек и 2 крас
ных. Если я наугад выберу фишку, шанс, что я выберу белую фишку, равен 100:2 или
50:1, как и шанс, что ваши “50:1 или больше” ответы правильны.
4. За каждый ответ “50:1 или больше”, данный вами, я буду вытягивать из мешоч
ка фишку. (Если хотите, вы можете сами вытягивать для меня фишки.) Я буду класть
фишки в мешочек, перед тем как снова вытягивать, таким образом, шансы не изменят
ся. Вероятность того, что я вытяну красную фишку, равна 1/51. Поскольку вытягива
ние красных фишек маловероятно, каждая красная фишка, вытянутая мною, будет
рассматриваться как “мое удивление”.
5. Каждый раз когда Вы удивлены неправильным ответом на вопрос “50:1 или боль
ше”, Вы платите мне $1 (увеличивая до 2.50 в некоторых условиях). Каждый раз, ког
да я удивлен, вытянув красную фишку, я плачу вам $ 1.
546 ВОСПРИЯТИЕ РИСКА
6. Если вы хорошо калиброваны, эта игра для Вас выгодна. Это потому, что я ожидаю
потерять $1 один раз из 51 попытки вытягивания фишки, в среднем. Но поскольку
ваши шансы иногда выше, чем 50:1, вы ожидаете иметь потери даже реже, чем я.
И н ф о р м и р о в а н и е лю дей о р и с к е
Трудно определенно думать о риске. К сожалению, это совершенно необхо
димо. Радиационный риск, медицинские побочные эффекты, профессио
нальные болезни, заражение пищевых продуктов, токсичные химические
препараты и неправильное срабатывание различных устройств все больше
заполняют наш и газеты и наш и мысли. Поскольку управление этими рис
ками жизненно важно для благосостояния индивида и общества, люди в на
стоящее время настаивают на своем праве играть активную роль в процессе
принятия решений. К ак результат этого, промоутеры и ответственные лица
опасных предприятий сталкиваются с увеличивающимся давлением по воп
росу информирования людей о риске, с которым они сталкиваются (см. рис.
5). Например, за последние годы:
Администрация по Продуктам и Лекарствам предписала делать ин
формационные вкладыши для пациентов по лекарствам, отпускае
мым по рецептам, количество которых растет.
Департамент жилищного строительства и городского развития на
чал требовать от продавцов домов, построенных до 1950 года, ин
формирования покупателей о присутствии свинцовых красок.
Предложенный закон об обязательствах федеральной продукции
отвел значительное место информированию покупателей и рабочих
о риске, с которым они могут, вероятно, столкнуться.
Белый Дом приказал Государственному секретарю по медицине, об
разованию и благосостоянию разработать общую информационную
программу по влиянию радиационного воздействия на здоровье.
550 ВОСПРИЯТИЕ РИСКА
Несмотря на эти хорошие намерения, разработка информационной про
граммы может быть довольно сложной. Делать это адекватно - означает
найти убедительные способы представления сложного, технического мате
риала, что часто омрачается неопределенностью. Не только из-за иногда
слиш ком ограниченного отведенного времени, но такж е из-за того, что со
общения должны противопоставлять предвзятое мнение слушателей (и,
возможно, неправильное мнение) о рассматриваемом риске его последстви
ям . Например, в некоторых ситуациях неправильный личный опыт может
содействовать ошибочному чувству безопасности, тогда к а к при других об
стоятельствах только обсуждение возможных неблагоприятных послед
ствий может увеличить их кажущ ую ся угрозу. Более того, к ак продемонст
рировали Росс и Андерсен (Глава 9), убеждения людей часто изменяются
медленно и показывают чрезвычайную устойчивость перед лицом опровер
гающего свидетельства. Далее идет краткий обзор некоторых дополнитель
ных проблем, с которыми сталкиваются информационные программы.
Выводы
Информирование людей предупреждающими этикетками, вкладыш ами в
упаковку или экстенсивными программами СМИ - это все ж е только часть
гораздо большей проблемы помощи людям в том, к ак справляться с риском
и неопределенностями современной ж изни. Мы убеждены, что некоторая
Факты против страха... 557
ответственность леж ит на наш их ш колах. Учебный план общественных
ш кол должен включать материал, разработанный для того, чтобы обучить
людей тому, что наш мир является вероятностным, а не детерминистским,
и чтобы помочь изучить стратегии суждений и решений, чтобы иметь дело с
этим миром (Beyth-Marom & Dekel, в печати). Эти стратегии так ж е необхо
димы для навигации в мире неопределенной информации, к ак геометрия и
тригонометрия - для навигации в мире физических объектов.
А т о м н а я э н е р ги я : и зу ч е н и е с л у ч а е в в о с п р и я т и я р и с к а
Нигде больше вопросы воспринимаемого риска не являю тся такими яр ки
ми или ставки такими высокими, как в полемике вокруг атомной энергии.
Этот раздел рассматривает эту полемику в свете только что сделанных вы
водов.
Общая проблема
Даже перед аварией на Три Майл Айленд атомная индустрия садилась на
мели враждебного общественного мнения. Значительное и упорное оппози
ционное движение было в ответе за дорогостоящие отсрочки в лицензирова
нии и сооружении новых атомных станций в Соединенных Ш татах и за по
литическую суматоху в нескольких европейских государствах.
Неисправный реактор на Три Майл Айленд стимулировал предсказуе
мый немедленный подъем в антиядерной лихорадке. Любая попытка пла
нировать роль атомной энергии в энергетическом будущем нации должна
считаться с решающими факторами этой оппозиции и предвидеть ее даль
нейший курс. Один ключ к разгадке леж ит в недавнем исследовании, пока
зывающем, что образы потенциальных ядерных катастроф, которые сфор
мировались в сознании антиядерной общественности, значительно отлича
ются от оценок, выдвинутых многими техническими экспертами. Мы опи
шем эти образы и поразмышляем об их происхождении, постоянстве и по
следствиям.
Основные восприят ия
Анкетное исследование людей, противостоящих атомной энергии, показыва
ет, что они судят о своей выгоде, как о достаточно низкой, а о своем риске -
как о неприемлемо большом (Fischhoff, Slovic, Lichtenstein, Read & Combs,
1978). Что касается выгодной стороны, то эти люди не видят атомную энер
гию как жизненно важное звено в удовлетворении основных энергетичес
ких потребностей (Р о к о т у , 1977); скорее, многие рассматривают ее как
дополнение к другим источникам энергии, которые сами являю тся адек
ватными (или их можно сделать адекватными путем защиты). Что касается
риска, то атомная энергия вызывает большее чувство страха, чем почти
558 ВОСПРИЯТИЕ РИСКА
любая другая технологическая деятельность (Fischhoff и другие, 1978).
Некоторые приписывают эту реакцию боязни невидимого и необратимого
радиационного зараж ения, угрожающего раком и ущербом на генетичес
ком уровне. Однако, использование диагностических рентгеновских лучей,
радиационной технологии, которая несет сходный риск, не так страшно.
Напротив, этот риск часто недооценивается (Slovic, Lichtenstein & Fischhoff,
1979). Ассоциация атомной энергии с ядерным оружием может объяснить
эти различие восприятия. Как результат ее насильственных истоков, к атом
ной энергии относятся к а к к технологии, чей риск является неконтролиру
емым, смертельным и потенциально катастрофическим. Эти характерис
тики не ассоциируются с применением диагностических рентгеновских
лучей.
Когда люди, противостоящие атомной энергии, описывают свои менталь
ные образы ядерной аварии и ее последствий, они обнаруживают ожида
ние, что серьезная авария реактора вероятна при их ж изни, и в ее результа
те могут быть сотни тысяч, даже миллионы смертей (Slovic, Fischhoff &
Lichtenstein, 1979; Slovic, Lichtenstein & Fischhoff, 1979).Также ожидает
ся, что подобная авария может стать причиной непоправимого ущерба ок
ружаю щ ей среде на огромной географической территории. Эти ожидания
драматически контрастируют с мнением атомной индустрии, что множ е
ственные системы безопасности сделают ущерб минимальным.
Одним неизбежным последствием этого “расхож дения в восприятии”
является неопределенность и недоверие части общественности, считающей,
что риск значительно больше, чем говорят оценки экспертов (Kasper, 1979;
S ta rr & W hipple, 1980). Эксперты, в свою очередь, подвергают сомнению
рациональность общественности и осуждают “эмоциональность”, ставящую
в тупик технологический прогресс. В результате - резкая и иногда грубая
конфронтация.
Признание этого расхождения в восприятии привело к заявлению экс
пертов, что общественность должна быть “образована” в отношении “реаль
ного” ри ска атомной энергии. Один ан ал и ти к общественного м нения
(Р о к о т у , 1977) определил вопрос следующим образом:
Наибольшая проблема, мешающая искушенному суждению по этому вопросу, - это не
достаток знаний и фактов. В такой обстановке ужасные рассказы, путаница и ирраци
ональность часто одерживают верх. Только посредством подробного изучения фактов и
знаний люди могут узнать, какой выбор является реальным.... (с. 12)
Выводы
Х отя излож енная выше дискуссия определила некоторые возможные ис
точники расхождения восприятия сторонников и противников использова
ния ядерной энергии, она не указала определенно на одну или другую сто
рону к а к имеющую наиболее точные оценки общего риска атомной энер
гии. Эффекты запоминаемости и воображаемости способны к ак усилить об
щественные опасения, так и сделать неясной осведомленность экспертов от
носительно ситуаций, в которых система может выйти из строя. Поскольку
о действительном риске можно никогда не узнать с большой точностью, а
новая информация имеет тенденцию быть интерпретированной таким об
разом, чтобы быть совместимой с предыдущими убеждениями человека, рас
хождение восприятии может оставаться довольно долгое время. Так, для
некоторых людей Три Майл Айленд “доказал” возможность катастрофичес
кого плавления, тогда как для других - подтвердил их веру в надежность
систем множественной безопасности и сдерживания.
К в о п р о су об о г р а н и ч е н и я х в о п р о сн о -о тв етн о й п а р а д и г м ы
В предыдущем разделе мы указали на возможность того, что внутригруп
повые планы и сократовы намеки могут подталкивать исследуемой интуи
ции. В действительности проблема намного шире. Большинство исследова
ний по суждениям в ситуации неопределенности и по индуктивным выво
дам проводилось в разговорной парадигме, при которой испы туемы м
предъявляется информация, и их просят ответить на вопросы или оценить
значения, устно или письменно. В этом разделе мы обсудим некоторые слож
ности и ограничения, связанные с этой вопросно-ответной парадигмой.
Использование коротких вопросников, заполняемых случайно мотиви
рованными испытуемыми, часто критикуется на том основании, что испы
туемые действовали бы иначе, если бы отнеслись к ситуации более серьез
но. Однако свидетельства показывают, что ошибки рассуждения и выбора,
которые были первоначально установлены в гипотетических вопросах, не
ликвидирую тся предъявлением более основательных стимулов (Grether,
1979;G rether & P lott, 1979; Lichtenstein & Slovic, 1971, 1973; Tversky &
K ahnem an, 1981). Гипотетические вопросы являю тся подходящими тогда,
574 ПОСТКРИПТУМ
когда люди способны предсказать, к а к бы они отвечали в более реалистич
ной обстановке, и когда у них нет никаких мотивов для лж и в своих отве
тах. Это не говорит о том, что поощрения и стимулы не воздействуют на суж
дения. Скорее, мы утверждаем, что ошибки рассуждения и выбора не исче
зают с присутствием поощрений. Ни газеты, ни исследование прошлых по
литических и военных решений не поддерживают оптимистического взгля
да, что рациональность преобладает, когда ставки высоки (Janis, 1972; Janis
& M ann, 1977; Jervis, 1975).
Возможно, более серьезный интерес в отношении вопросно-ответной па
радигмы состоит в том, что мы не можем безопасно предположить, что “эк
спериментальные разговоры”, в которых испытуемые получают сообщения
и отвечают на вопросы, будут имитировать выводы, которые люди делают
при обычном взаимодействии со средой. Хотя некоторые суждения в повсед
невной ж изни являю тся ответом на точные вопросы, многие не являются
таковыми. Более того, разговорные эксперименты во многом отличны от
обычного социального взаимодействия.
Интерпретируя ответы испытуемых, экспериментаторы находятся в ис
куш ении предположить, (i) что вопросы только лиш ь вы являю т у испытуе
мы х открытые вы раж ения мыслей, которые возникнут у них самопроиз
вольно, и (ii) что вся информация, данная испытуемому, включена в экспе
риментальное сообщение. С точки зрения испытуемого ситуация выглядит
несколько иначе. Во-первых, вопрос, который задает экспериментатор, мо
ж ет возникать не самопроизвольно в ситуации, которую эксперт имитиру
ет. Во-вторых, испытуемого обычно интересуют многие вопросы, которые
экспериментатор никогда и не думал задавать, такие как: Существует ли
правильный ответ на этот вопрос? Ожидает ли экспериментатор, что я его
обнаружу? Вероятно ли вообще, что очевидный ответ правилен? Дает ли
вопрос какие-либо намеки на ожидаемый ответ? Что определило отбор ин
формации, предоставленной мне? Может ли часть ее быть иррелевантной,
чтобы ввести меня в заблуждение, или вся она релевантна? Единственный
открытый ответ, наблюдаемый экспериментатором, определяется частич
но ответами испытуемого на эту группу подразумеваемых вопросов. И экс
периментальное сообщение является лиш ь одним из источников информа
ции, которую использует испытуемый для генерации к а к открытых, так и
скрыты х ответов (О т е , 1973).
Вслед за лекциями Грайса Вильяма Джеймса в 1967 году (Grice, 1975),
большой массив литературы по философии, лингвистике и психолингвисти
ке имел дело с вкладом принципа кооперативности в значение изречений (для
справок см. Clark & Clark, 1977). Согласно этому принципу, слушатель в раз
говоре имеет право предположить, что говорящий старается быть “информа
тивным, правдивым, релевантным и понятным” (Clark & Clark, 1977, с. 560).
Грайс составил список нескольких принципов, которым обычно будет следо
вать кооперативный говорящий. Например, принцип количества запрещает
говорящему говорить то, что слушатель уже знает или мог бы легко понять из
К вопросу о статистической интуиции 575
контекста или оставшейся части сообщения. Именно по этому принципу ут
верждение “Джон пытался убрать в доме” выражает, что попытка была бе
зуспешной: Слушатель может предположить, что успешная попытка была
бы описана более простым предложением: “Джон убрал в доме”.
Испытуемые приходят на эксперимент с опытом кооперативности в раз
говоре, полученным в течение всей жизни. Они обычно ожидают увидеть
кооперативного экспериментатора, хотя это ожидание часто ошибочно.
Предположение кооперативности оказывает много еле уловимых эффектов
на интерпретацию испытуемых предоставляемой им информации. В осо
бенности, оно делает исключительно сложным для экспериментатора ис
следование эффектов “иррелевантной” информации. Поскольку представ
ление иррелевантной информации нарушает правила разговора, вероятно,
испытуемые ищ ут релевантность в любом экспериментальном сообщении.
Например, Тейлор и Крокер (Taylor и Crocker, 1979) комментировали факт,
что впечатления испытуемых о человеке находились под влиянием утвер
ждений, которые истинны для всех, например, “Марк скромен в отношени
ях со своими профессорами”. Но вывод испытуемых о том, что Марк необы
чайно скромен, может быть оправдан убеждением, что кооперативный экс
периментатор не включил бы полное избыточное утверждение в описание
личности. Сходные вопросы поднимаются в других исследованиях (напри
мер, Kahneman & Tversky, 1973; N isbett, Zukier & Lemley, 1981), которые
исследовали воздействие иррелевантной и ненужной информации.
Роль предположений, заложенных в вопросе, была проиллюстрирована
Лофтусом и Пальмером (Loftus и Palm er, 1974), которые показали, что сви
детели давали более высокую оценку скорости машины, когда их спраши
вали “К ак быстро ехала машина, когда она разбила вдребезги другую ма
ш ину?”, чем когда вопрос был “К ак быстро ехала машина, когда она удари
ла другую машину? ”. Использование в вопросе слова разбила подразумева
ет, что задающий вопрос, если он откровенен и кооперативен, убежден, что
маш ина ехала быстро.
Нормативный анализ подобного вывода может быть разделен на две ста
дии проблемы, (i) Должен ли свидетель находиться под влиянием вопроса,
формируя личное мнение относительно скорости машины? (ii) Должен ли
свидетель находиться под влиянием вопроса, формулируя общественную
оценку? Ответ на (i) должен быть положительным, если вопрос выражает
новую информацию. Ответ на (ii) менее ясен. С одной стороны, каж ется не
подходящим для ответа, если он вторит информации, содержащейся в воп
росе. С другой стороны, от кооперативного свидетеля ожидают, что он даст
наилучшую возможную оценку, отвечая на вопрос о количестве. Что ж е
делать свидетелю, если на эту оценку только что повлиял вопрос? Следует
ли ему ответить: “Перед тем, к ак вы спросили меня, я думал, ч т о ... ”? К аки
ми бы ни были нормативные достоинства случая, свидетельства показыва
ют, что люди часто неспособны изолировать прошлые мнения от настоящих
или оценить вес факторов, оказавш их воздействие на их взгляды (Fischhoff,
576 ПОСТКРИПТУМ
1977b; Goethals&Reckman, 1973; Nisbett&W ilson, 1977; Ross & Lepper, 1980).
Наше исследование привязки (Tversky & Kahneman, 1974, 1) далее ил
люстрирует силу едва уловимых предположений. В одном исследовании мы
просили группу испытуемых оценить вероятность того, что население Тур
ции было больше, чем 5 млн, а другую группу мы попросили оценить веро
ятность того, что население Турции было меньше, чем 65 млн. Следуя этому
заданию, две группы записали свои наилучшие догадки относительно насе
ления Турции; средние оценки были 17 и 35 млн, соответственно для групп,
которым представили низкие и высокие привязки. Эти ответы могут быть
такж е рационализированы предположением, что значения, которые появ
ляю тся в вопросах о вероятности, не слишком далеки от правильных.
Мы доказывали, что эффекты предположения иногда могут быть оправ
даны, поскольку нет ясного разграничения между предположением и ин
формацией. Однако важно отметить, что люди не принимают предположе
ния, потому что так нужно. Во-первых, они обычно не знают, что на них
повлияло предположение (Loftus, 1979; N isbett& W ilson, 1977). Во-вторых,
сходные эффекты предположения наблюдаются даж е тогда, когда респон
денты не могут основательно верить, что привязка, данная им, несет инфор
мацию. Испытуемые, которым требовалось дать оценки количества, регу
лируя вверх или вниз от случайно генерированного значения, демонстри
ровали сильное проявление эффектов привязки (Tversky & Kahneman, 1974,
1). Но неспособность предполагать, к ак таковая, является беспокойством, а
явн ая неспособность отвергать - неинформативные сообщения.
Когда испытуемым требуется указать свой ответ, выбрав ответ из списка
или построив распределение вероятности по данному набору альтернатив,
выбор категорий экспериментатором может быть информативным. Лофтус
(Loftus, 1979) показал, что респонденты сообщали о гораздо большем коли
честве случаев головной боли в неделю, когда ш кала ответов была выраже
на к а к 1-5, 5 -1 0 ,1 0 -1 5 и т.д ., чем когда ш кала была выраж ена к ак 1-3, 3-5,
5-7 и т.д. В этом случае ш кала могла законно влиять на границы того, что
должны назы вать головной болью. Даже когда такие повторные интерпре
тации не являю тся возможными, можно ожидать, что испытуемые пред
почтут среднюю часть области распространения в своих оценках количе
ства и построят субъективное вероятностное распределение, в котором к аж
дая категория определена неявной вероятностью (Olson, 1976; Parducci,
1965).
П редположения, подразумеваемые опросником, могут такж е вносить
вклад в результаты, наблюдавшиеся Фишхоффом, Словиком и Лихтенш
тейном (1978), которые просили неопытных испытуемых и опытных авто
механиков оценить вероятность различных неполадок, которые могут быть
причиной нарушений в запуске машины. Они обнаружили, что оцененная
вероятность категории “все другие проблемы” была достаточно нечувстви
тельна к полноте списка и едва увеличилась, когда основной фактор (на
пример, вся электрическая система) был удален из списка.
К вопросу о статистической интуиции 577
Даже едва уловимые и косвенные ключи к разгадке могут быть эффектив
ны. В недавнем исследовании мы дали испытуемым следующую информа
цию: “Мистер А - кавказец, 33 лет. Он весит 190 фунтов”. Одну группу испы
туемых попросили угадать его рост. Другие испытуемые такж е пытались до
гадаться о его росте, после того, к ак сначала пытались догадаться о размере
его талии. Средняя оценка была значительно выше в первой группе, пример
но на один дюйм. Мы подозреваем, что испытуемые, сначала оценивавшие
размер талии приписали большую часть веса мистера А его обхвату, чем это
сделали испытуемые, которые только лишь угадывали его рост.
Мы заключаем, что разговорный аспект исследований суждений заслу
ж ивает более тщательного рассмотрения, чем он получил в прошлых иссле
дованиях, вклю чая наше собственное. Мы не можем всегда предполагать,
что люди сделают или должны сделать тот ж е вывод, наблюдая ф акт и слу
ш ая сообщение об этом ж е факте, потому что правила разговора, которые
регулируют коммуникацию между людьми, не применимы к информации,
которая получена из естественного наблюдения. Часто трудно задавать воп
росы, не давая (полезных или вводящих в заблуждение) ключей относитель
но правильного ответа и не вы раж ая информации об ожидаемом ответе.
Обсуждение родственного нормативного вопроса, касающегося интерпре
тации-свидетельства, включено в исследование Бар-Хиллел и Ф олк (Ваг-
Hillel и Falk, 1980).
Естественно, вероятно, что факторы предубеждения, упомянутые нами,
будут оказывать наибольшее воздействие в ситуациях высокой неопреде
ленности. Испытуемые не будут придавать много значенияинтерпретаци-
ям разговорного отношения экспериментатора, если они будут противоре
чить уверенному знанию правильного ответа на вопрос. Однако, в области,
где было проведено большинство исследований суждений, изменения раз
говорного контекста могут воздействовать на процесс рассуждения так же,
как и на наблюдаемый ответ.
О ш и бки с у ж д ен и я: п о л о ж и т е л ь н ы й и о т р и ц а т е л ь н ы й а н а л и з
Часто полезно различать положительную и отрицательную стороны оши
бок суждения. Положительный анализ концентрируется на факторах, ко
торые производили частично неправильный ответ; отрицательный анализ
объясняет, почему не был дан правильный ответ. Например, положитель
ный анализ ошибки ребенка в задаче П иаже пытается обозначить факторы,
которые определяют ответ ребенка, такие как относительная высота или пло
щадь поверхности двух контейнеров. Отрицательный анализ того ж е пове
дения сфокусировался бы на препятствиях, которые помешали ребенку
получить и понять сохранение объема. В исследовании суждений в ситуа
циях неопределенности положительный анализ касается эвристики, кото
рую используют люди в суждениях, оценках и предсказаниях. Отрицатель
ный анализ связан со сложностями понимания и применения элементар
578 ПОСТКРИПТУМ
ных правил рассуждения. В случае ошибки понимания отрицательный ана
лиз фокусируется на препятствиях, которые мешают людям открыть реле
вантное правило самим или принять простые его объяснения. Отрицатель
ный анализ ошибки применения стремится идентифицировать способы, при
которых кодирование проблем может скрывать релевантность правила, ко
торое известно и принято.
В общем, положительный анализ ошибки наиболее полезен тогда, когда
одна эвристика объясняет суждения в разнящ емся наборе проблем, где на
рушаются различные нормативные правила. Соответственно, отрицатель
ный анализ будет наиболее показательным, когда люди последовательно
наруш ают правило в различных проблемах, но совершают ошибки, кото
рые нельзя отнести к одной эвристике. Тогда становится уместным вопрос,
почему люди не могут выучить правило, если рутинные наблюдения повсед
невных событий предлагает достаточно возможностей для этого. Такж е ста
новится уместным вопрос, почему люди сопротивляются правилу, если их
не убеждают простые валидные доводы. Сложности изучения статистичес
к и х принципов на повседневном опыте обсуждались несколькими автора
ми, наиболее полно Айнхорном, Хогартом (Einhorn и Hogart, 1978), Л.Р.Гол-
дбергом (L. R. Goldberg, 1968b), Нисбеттом и Россом (N isbett и Ross, 1980).
Неудачи научения обычно исходят из недоступности необходимого кодиро
вания релевантных примеров или к отсутствию корректирующей обратной
связи по ошибочным суждениям. Сопротивление принятию правила обыч
но приписывается его не-интуитивной природе. В качестве примера мы об
ратимся теперь к анализу причин сопротивления правилу регрессивного
прогнозирования.
Исследования интуитивного прогнозирования обеспечили много свиде
тельств преобладания тенденции делать прогнозы, которые являю тся ра
дикальны ми или недостаточно регрессивными. (Недавний обзор этой лите
ратуры см. в Главе 15). В более ранних статьях мы предлагали положитель
ны й анализ этого эффекта как проявление репрезентативной эвристики
(K ahnem an & Tversky, 1973,4; 1979а, 30). Однако, как мы увидим, есть ос
нования для того, чтобы обратиться к отрицательному анализу для более
понятной трактовки.
Отрицательный анализ представляет особый интерес в случае с ошибка
ми понимания, при которых люди находят правильное правило не-интуи
тивным или даже контр-интуитивным. Как засвидетельствует большинство
преподавателей элементарной статистики, студенты находят концепцию
регрессии очень сложной для понимания и применения, несмотря на ж и з
ненный опыт, в котором крайние прогнозы было часто слишком крайними.
Спортивные тренеры и учителя, например, знакомы с проявлениями рег
рессии к среднему: за исключительными достижениями чаще идет разоча
рование, а за неудачами - улучшение.
Более того, когда регрессия критериальной переменной по предсказыва
ющей переменной в действительности линейна, и когда условное распреде
К вопросу о статистической интуиции 579
ление критерия (для фиксированных значений предсказывающей перемен
ной) симметрично, правило регрессивного прогнозирования может быть за
щищено непреодолимым доводом: имеет смысл сделать одинаковый про
гноз для всех случаев, которые имеют одинаковое значение предсказываю
щей переменной, и имеет смысл выбрать этот прогноз так, чтобы средняя
величина и медиана критериального значения, для всех случаев, которые
делят одинаковое предсказанное значение Y, равнялось Y. Это правило, од
нако, противостоит другим видам интуиции, некоторые из которых обсуж
даются в следующих абзацах.
1. “Оптимальное правило прогнозирования должно, по крайней мере,
позволять, если не гарантировать, совершенно точное прогнозирование для
целого набора случаев”. Принцип регрессивного прогнозирования наруш а
ет это, по-видимому, благоразумное требование. Он выдает набор предска
занных значений, который имеет меньшее различие, чем соответствующий
набор действительных значений критерия и, таким образом, исключает воз
можность набора совершенно точных прогнозов. В самом деле, правило рег
рессии гарантирует, что ошибка будет допускаться в каждой паре коррели
рующ их наблюдений: мы никогда не сможем найти сына, чей рост был пра
вильно предсказан по росту его отца, и такж е позволял точное прогнозиро
вание роста отца, за исключением, когда оба значения находятся в середи
не распределения роста. Странно, что правило прогнозирования, гаранти
рующее ошибку, должно превратитьс т в оптимальное.
2. “Связь между наблюдением и основанным на нем прогнозированием
должна быть симметрична”. По-видимому, благоразумно ожидать, что, если
В предсказано по знаниям об А, тогда А должно быть соответствующим про
гнозом, когда известно В. Регрессивное прогнозирование, конечно же, на
рушает эту симметрию, поскольку прогнозирование двух переменных друг
от друга регулируется не одним я тем ж е уравнением регрессии. Родствен
ная асимметрия встречается при сравнении регрессивного прогнозирования
с действительными значениями критериальной переменной. Регрессивное
прогнозирование не подвержено предубеждению, в том смысле, что среднее
критериальное значение, во всех случаях, для которых было предсказано
частное значение Y, ожидается к ак Y. Однако, если мы рассмотрим все слу
чаи, для которых критериальное значение было Y, окажется, что среднее
значение их предсказанных показателей будет лежать между Y и группо
вым средним значением. Эти асимметрии являю тся загадочными и контр
интуитивными для сообразительных, но статистически неопытных людей.
Асимметрии регрессивного прогнозирования особенно проблематичны,
когда первоначальное наблюдение и критерий генерированы одним и тем
ж е процессом и априорно не отличаются, к ак в случае повторного осуще
ствления выборки из той же совокупности или в случае параллельных форм
одного теста. Единственной моделью прогнозирования, которая удовлетво
ряет симметрии в подобных ситуациях, является правило отождествления,
при котором показатели по второй форме предсказываются к ак такие ж е,
580 ПОСТКРИПТУМ
что и при первоначальном наблюдении. Принцип регрессивного прогнози
рования представляет различие, для которого нет никаких очевидных ос
нований: к ак можно предсказать знак разницы между двумя значениями,
выбранными из одной совокупности, как только становится известным одно
из этих значений?
3. “Любой системный эффект должен иметь причину”. Разница между
первоначальными наблюдениями и действительными критериальными зна
чениями является фактом, который можно наблюдать при любом типе рас
сеивания. Однако он оказывается эффектом без причины. Например, в си
туации повторного теста знание о том, что первоначальные показатели были
высоки, влечет за собой прогнозирование, что последующие будут ни же, но
первое наблюдение не является причиной того, что второе будет ниже. По
явление беспричинного эффекта нарушает вескую интуицию. В самом деле,
пониманию регрессии сильно мешает тот факт, что любому примеру регрес
сии, с которым случайно сталкиваешься, вероятно, будет дано причинное
объяснение. Например, в к о н т е к с т умелого выполнения регрессия от пер
воначального теста к последующему обычно приписывается напряженно
му усердию после первой неудачи и чрезмерной уверенности, следующей за
первоначальным успехом. Часто трудно осознать, что выполняющие будут
регрессировать, далее не зная результатов, а только из-за непреодолимой
ненадежности своего выполнения. Регрессия первого выполнения по вто
рому такж е удивительна, потому что ей нельзя дать простого причинного
объяснения.
Мы сделали набросок отрицательного анализа сложностей, которые ис
пытываю т люди в понимании и применении концепции регрессивного про
гнозирования. Мы предполагаем, что у людей есть сильная интуиция отно
сительно статистического прогнозирования, и что некоторые нормативно
правильные принципы являю тся контр-интуитивными именно потому, что
они нарушают их существующую интуицию. С этой точки зрения, “прин
ципы ” , которые люди принимают, представляют значительные убеждения,
а не только лиш ь рационализации, и они играют существенную роль в за
медлении изучения верных правил. Однако эти убеждения часто являю тся
противоречивыми и, следовательно, непонятными. Например, невозмож
но построить не-выражденное совместное распределение роста отцов и (пер
вых) сыновей так, чтобы средний рост отца был бы объективным предска
зывающим фактором роста сына, а рост сына был бы объективным пред
сказываю щ им фактором роста его отца.
В заклю чении, мы предположили, что некоторые ошибки и предубежде
н и я в суж дениях в ситуациях неопределенности требуют двойственного
анализа: положительной стороны, которая объясняет выбор частного ош и
бочного ответа в терминах эвристики, и отрицательной стороны, объясняю
щ ей, почему правильное правило не было выучено. Хотя эти два анализа не
являю тся несовместимыми, они имеют тенденцию придавать большое зна
чение различным аспектам изучаемого феномена. П опытка интегрировать
К вопросу о статистической интуиции 581
положительные и отрицательные стороны, похоже, обогатит теоретический
анализ индуктивного рассуждения.
Р е зю м е
В этой главе мы обратились к трем группам методологических и концепту
альных проблем в области суждений в ситуациях неопределенности. Во-пер
вых, мы сделали различие между ошибками применения и ошибками пони
мания и обсудили различные методы изучения статистической интуиции. Во-
вторых, мы сделали обзор некоторых ограничений вопросно-ответной пара
дигмы исследования суждений и исследовали эффекты мысленных предпо
ложений, сократовых намеков и правил разговора. В-третьих, мы обсудили
роль положительных и отрицательных объяснений ошибок суждения.
Соображения, выдвинутые в этой главе, усложняют эмпирический и тео
ретический анализ суждений в ситуациях неопределенности; они также пред
лагают новые направления будущих исследований. Мы надеемся, что более
глубокая оценка концептуальных и методологических проблем, связанных
с изучением статистической интуиции, приведет к лучшему пониманию слож
ностей, тонкостей и ограничений индуктивного рассуждения человека.
35. Варианты неопределенности*
*Эта глава впервые появилась в Cognition, 1982,11.143-157. Авторские права© 1981 при
надлежат Elsevier Sequoia. Печатается в соответствии с разрешением.
Варианты неопределенности 583
но возможных последствий действий. На всех уровнях действие должно
предприниматься до того, как прояснена неопределенность, и должен быть
достигнут надлежащ ий баланс между высшим уровнем специфической го
товности к событиям, которые произойдут с наибольшей вероятностью, и
общей способностью отвечать соответствующим образом, когда случается
непредвиденное. Поскольку фокус настоящей трактовки скорее находится
на убеждении, чем на действии, мы не будем обсуждать замечательные про
цессы, когда низш ие организмы распределяют свое ответное усилие в соот
ветствии с вероятностью подкрепления (H errnstein, 1970). Наш главный
интерес в этом разделе относится к неопределенности восприятия.
О жидания
(категории и (настройка)
предположения)
Неопределенность
В ариант ы неопределенности
Второй уровень на Рисунке 2 различает четыре прототипных варианта неопре
деленности, идентифицированной характером данных, которые может рассмат
ривать человек, выносящий суждение, оценивая вероятность. Внешняя нео
пределенность может быть оценена двумя способами: (i) согласно распредели
тельной форме, когда рассматриваемый случай принимается как пример класса
подобных случаев, для которых относительная частота известна или можетбыть
оценена; (ii) согласно единичной форме, когда вероятности оцениваются из на
личных особенностей частного рассматриваемого случая. Эти две формы суж
дения иллюстрируются следующей правдивой историей.
О психологии прогнозирования 591
Группа, имевш ая дело с разработкой учебного плана высшей ш колы по
мышлению в условиях неопределенности, проводила заседание по плани
рованию. Бы л поднят вопрос о времени, которое потребуется, чтобы завер
ш ить первый вариант учебника. Участников обсуждения попросили оце
нить это значение как можно более реалистично; семь оценок ранжирова
лись от 18 месяцев до 3 лет. Тогда руководитель группы обратился к одному
из участников, работнику сферы образования со значительным опытом в
проблемах разработки учебных планов со следующим вопросом: “Каков был
опыт других групп, которые пытались написать учебник и разработать учеб
ный план в новой области, где не существовало никаких предшествующих
учебных курсов? Сколько им потребовалось времени, чтобы закончить учеб
ник, начиная с той стадии, в которой находится наш проект?” Приводящий
в уныние смысл ответа оказался даже более неожиданным для эксперта,
который его давал, чем для остальных участников: “Большинство групп, о
которых я могу вспомнить, потерпели неудачу и так и не закончили учеб
ник. У тех, кто преуспел в этом деле, время завершения составляет от 5 до 9
лет, со средним значением 7 лет”.
Последующая обнаружила обнаружило, что все участники произвели
свои первоначальные оценки согласно единичной форме, строя планы и сце
нарии с некоторым допуском безопасных резервов для непредвиденных слу
чайностей. Из-за эффектов привязки (Kahneman & Tversky, 1974,1) оцен
ка, полученная при добавлении безопасных резервов к текущим планам,
наиболее вероятно, будет в высокой степени оптимистичной. Примечатель
ным аспектом этого эпизода было то, что релевантные данные распределе
ния не были использованы самопроизвольно, хотя они были в наличии у
одного из экспертов в личном знании, и могли быть оценены достаточно точ
но несколькими другими участниками.
Наш пример иллюстрирует применение распределительной и единичной
формы рассуждений в прогнозировании непрерывной переменной: време
ни, требуемого на завершение проекта. Данные распределения, в этом слу
чае, состояли из знания об относительной частоте различных сроков завер
ш ения. Конечно ж е, подобное рассуждение можно применить, чтобы оце
нить вероятность дискретного результата, такого к ак провал проекта. От
носительная частота такого результата в релевантном классе обеспечивает
основу для распределительной оценки вероятности, а другая информация о
частном случае, использованная в единичной форме, может нести отпеча
ток склонности к провалу или к успеху. Существует много примеров, в ко
торых к одному и тому же вопросу можно подойти к ак с позиции единич
ной, так и распределительной формы.
Сравните следующие примеры:
1. “Есть шанс, что ты застанешь Джона дома, если позвонишь завтра утром. Он го
ворил, что предпочитает работать дома”.
2. “Есть шанс, что ты застанешь Джона дома, если позвонишь завтра утром. Он ча
сто был дома, когда я звонил ему”.
592 РЕПРЕЗЕНТАТИВНОСТЬ
Утверждение 1 допускает только единичное суждение о вероятности, что
Джон будет дома. Утверждение 2 могло бы поддержать как распределитель
ную, так и единичную оценки. Относительная частота сходных событий, когда
Джон был утром дома, обеспечивает естественную оценку вероятности, что
он будет там завтра, но это выражение также наделило Джона склонностью
проводить утро дома, в большей степени, чем это сделало Утверждение 1.
Мы предположили (Kahneman & Tversky, 1979а, 30), что люди обычно
предпочитают единичную форму, согласно которой они принимают “внут
реннюю точку зрения” причинной системы, который немедленно выдает ис
ход, в большей степени “внешнюю точку зрения”, которая связывает рассмат
риваемый случай со схемой осуществления выборки. Наш пример планиро
вания иллюстрирует это предпочтение единичной модели. Он также иллюст
рирует еще один эффект, который, как мы подозреваем, достаточно общий:
распределительная форма суждения с большей вероятностью, чем единич
ная, выдает точные оценки значений и разумную оценку вероятности.
Теперь мы обратимся к различию между формами оценки внутренней
неопределенности, которые иллюстрируют следующие примеры:
3. “Я полагаю, что Нью-Йорк севернее Рима, но я не уверен”.
4. “Я думаю, ее зовут Дорис, но я не уверен”.
Обсуждение
Хотя язы к вероятности может быть использован для выражения любой фор
мы неопределенности, законы теории вероятности не применяются ко всем
вариантам неопределенности с одинаковой силой. Наиболее вероятно, эти
законы принимаются и удовлетворяются в интуитивных суждениях, когда
внеш няя неопределенность оценивается согласно распределительной, или
частотной, форме. Например, комплементарность субъективной вероятнос
ти является очень непреодолимой тогда, когда мы обращаемся к статисти
ческим данным о погоде, чтобы оценить вероятность того, что будет дождь 12
апреля следующего года: релевантный набор прошлых апрельских дней впол
не можно разделить на дождливые дни и дни, когда дождя не было.
Комплементарность менее непреодолима в других вариантах. Когда нео
пределенность оценивается в терминах склонности возможности, доводов
или уверенности, менее очевидно, что вероятность следует увеличивать до
единицы, - даже если определенно известно, что одна из альтернатив пра
вильна. Например, можно подвергнуть сомнению, почему степень убежден
ности в утверждении, что Нью-Йорк севернее Рима, и степень убежденнос
ти в утверждении, что Нью-Йорк южнее Рима, должны в сумме давать то
ж е значение, что и степени убежденности для любой другой пары компле
м ентарны х утверждений. В самом деле, некоторые авторы (например,
Cohen, 1977; Shafer, 1976) предполагали, что комплементарность не следу
ет применять к степеням убежденности. В частности, Шафер оспаривал ком
плементарность убежденности на том основании, что существуют ситуации,
в которых две взаимоисключающие и исчерпывающие гипотезы обе имеют
существенную поддержку, и другие ситуации, в которых ни одна из гипо
тез не имеет особой поддержки. Сходные вопросы могут быть подняты в от
ношении необходимости комплементарности в ощущении уверенности и в
оценке конфликтных склонностей.
Варианты неопределенности могут различаться по уверенности, с кото
рой они оцениваются. Представьте, что канцелярская кнопка была подбро
ш ена четыре раза и упала дважды на кончик и дважды на головку. Имея
эти данные, наблюдатели определят вероятность 0.5 событию, что кнопка
упадет на головку при следующем подбрасывании. Они такж е определят
вероятность 0.5 событию, что подброшенная монета покажет “реш ку”, но
они выражаю т гораздо большую уверенность в своем суждении о монете,
чем о кнопке. К ак иллюстрирует этот пример, вполне возможно определить
различную степень уверенности одному и тому ж е суждению о возможнос
ти. Уверенность в отношении вероятностей важ на, поскольку она контро
лирует решения. Есть свидетельства (Ellsberg, 1961; R aiffa, 1961), что .люди
предпочитают ставить на события, которые имеют известные вероятности,
такие к а к подбрасывание монеты, а не события, которые связаны с комби
нацией внешней неопределенности и неведения, такие к ак подбрасывание
канцелярской кнопки.
Существуют естественные связи между концепциями вероятности, выд
винутыми различными ш колами, изучающими эту тему, и формами нео
пределенности, которые мы обсудили. Так, частотная, или объективная,
интерпретация вероятности ограничивает концепцию до внешней неопре
деленности, генерируемой процессом осуществления выборки. Наоборот,
ш кола Байеса, или личностная ш кола, трактует всю неопределенность к ак
незнание. Согласно ш коле Байеса, предпочтения являю тся основой убеж
дений, а вероятности являю тся производными от предпочтений между пари.
Однако с психологической точки зрения эта эвристика пари каж ется нереа
листичной . Обсуждения в этой области всегда были острыми из- за существо
вания различны х видов интуиции, которые являю тся индивидуально вы з
ванными и взаимно несовместимыми, и из-за того, что нет согласия по к р и
терию для разреш ения нормативных споров, когда эти виды интуиции кон
фликтуют. Психологический анализ, возможно, мог бы внести вклад в нор
мативное обсуждение, обеспечив адекватное описание видов интуиции, из
которых черпают свою привлекательность различные позиции.
Литература
спецфакультет
«Организационная психология»
Гуманитарны й Ц ентр проводит очередной прием
слуш ателей на спецфакультет. А кадемическая пере
подготовка специалистов с высш им образованием для
профессиональной работы по управлению организаци
ей, взаимодействию с клиентам и, менеджменту пер
сонала, рекламе и связям с общественностью.
Принятие решений
в неопределенности
Правила и предубеждения