Вы находитесь на странице: 1из 632

Judgment under Uncertainty:

Heuristics and biases

Edited by
Daniel Kahneman
University of British Columbia

Paul Slavic
Decision Research
A Branch of Perceptronics, Inc.
Eugene, Oregon

Amos Tversky
Stanford University

This work in preparing this book was supported by Office of Naval Research
Grant N00014-79-C-0077 to Stanford University and by Office of Naval
Research Contract N0014-80-C-0150 to Decision Research.

Cambridge
UNIVERSITY PRESS, 2001
Даниелъ Канеман П ауль Словак
А м ос Тверски

Принятие решений
в неопределенности

Правила и предубеждения

П од редакцией
Заслуж енного работ ника высшей ш колы
Российской Федерации, доктора психологических наук,
проф. Г. В. Суходольского

Перевод с английского

Гуманитарный Центр
Харьков, 2005
УДК 1 5 9 .9 2 2 .2 7
ББК 8 8 .5 3

Научный редактор: доктор психол. наук Г. Б. Суходольский (СПбГУ),


Редактор: доцент, кандидат психол. наук С. Г. Тарасов (СПбГУ)
Перевод. Изд-во И нститут прикладной психологии
“Гуманитарный Ц ентр”

Д. К анем ан, П. Слоник, А . Т верски. П ринятие реш ений


в неопределенности: П равила и предубеж дения / Пер. с англ. -X .:
Изд-во Институт прикладной психологии
“Гуманитарный Центр”, 2005,- 632 с.
ISBN 9 6 6-8 3 2 4 -1 4 -5

Перед Вами фундамент альный т руд по психологии принятия реш ений .


Ссылки на отдельные работы эт их авторов достаточно часто встречаются
в академической лит ерат уре , но полный сборник эт их статей на русском
язы ке опубликован впервые . Выход этой книги , безусловно , важное событие
для специалист ов в области управления , ст рат егического планирования ,
принятия решений , поведения потребителей и m 3 .
Книга представляет интерес для специалистов в области менеджмента ,
экономики , психологии , как в теории , тпатс и в практ ике , которые имеют дело
с такой сложной и интересной областью человеческой деят ельност и , /са/с
принятие решений.

You сага see а fundam ental work on psychology of decision-making . The references
to separate works of these authors can be found often enough in the academ ic
literatu re , Z?uZ Jfre complete volume of these articles has been published in Russian
for the first tim e . T7*e issue о / £/us froofe is undoubtedly an im portant event for the
experts in the field of m anagem ent , strategic planning , decision-making , consumers*
conduct etc .
TTie froofe is о / in terest to the experts in the field of m anagem ent , econom y ,
psych ology , iu theory as well as in p r a c tic e , irfro d eai u;i£/i such com plex and
in terestin g sphere of hum an action as decision-m aking.

Все права защищены. Никакая часть данной книги не может быть воспроизведена в
какой бы то ни было форме без письменного разрешения владельцев авторских прав. Права
на публикацию книги на русском языке принадлежат издательству «Гуманитарный
Центр».
© Cambridge University Press, 2001
© Институт прикладной психологии «Гу­
ISBN 0-521-28414-7 (англ.)
манитарный центр», перевод на русский
ISBN 966-8324-14-5 язык, оформление, 2005
Содержание

Предисловие научного редактора......................................................... 9


Предисловие авторов............................................................................... 11

Часть I: Введение....................................................................................... 15
1. П ринятие реш ений в условиях неопределенности: правила и
предубеждения..................................................................................... 17

Часть II: Репрезентативность................................................................. 37


2. Вера в закон малых чисел................................................................... 39
3. Субъективная вероятность: оценка репрезентативности............ 49
4 .0 психологии прогнозирования........................................................ 66
5. Изучение репрезентативности.......................................................... 89
6. О ценкирецрезентативностиинаосноверепрезентативности.... 105

Часть III: Причинность и атрибуция.................................................... 121


7. Общепринятое положение: инф ормация не обязательно
информативна....................................................................................... 123
8. Причинные схемы при принятии реш ений в условиях
неопределенности................................................................................ 140
9. Недостатки процесса атрибуции: о происхождении и
исправлении ошибочных социальных оценок.................................. 153
10. Очевидное воздействие базового значения................................... 179
Часть IV:Доступность............................................................................. 189
11. Доступность: эвристика оценки частоты и вероятности......... 191
12. Эгоцентрические предубеждения в доступности и атрибуции.. 208
13. П редубеждения доступности в социальном восприятии и
взаимодействии........................................................................................ 220
14. Эвристика моделирования............................................................ 232

Часть V: Ковариация и контроль........................................................... 241


15. Субъективная оценка ковариации: суж дения, основанные
на данных против суждений, основанных на теориях................ 243
16. И ллю зия контроля............................................................................ 265
17. Результаты тестов - такие, каким и Вы их себе представ­
ляете...................................................................................................... 274
18. Вероятностные рассуж дения в клинической медицине:
проблемы и возможности................................................................. 286
19. Получение знаний из опыта и условно-оптимальных правил
при принятии реш ения..................................................................... 308

Часть VI. Чрезмерная уверенность............................................... 327


20. Чрезмерная уверенность в суж дениях, основанных на
конкретны х примерах.............................................................. 329

21. Сообщение о процессе обучения оцениванию вероят­


ности.............................................................................................. 337

22. Калибровка вероятностей: положение дел к 1980 г............. 351

23. Обреченным необходимо изучать прошлое: эвристики и


пред убеждения в ретроспективе............................................. 383

Часть VII: Многоступенчатая оценка.................................................. 403


24. Оценка составных вероятностей в последовательном выборе... 405

25. Консерватизм в процессе обработки информации человеком... 410

26. Гипотеза угады вания в многоступенчатом выводе..................... 422

27. Заклю чения о личны х характеристиках на основе


информации, восстановленной из пам яти.................. 431
ЧастьVIII: Коррективные процедуры.................................................. 445
28. У стойчивая привлекательность ошибочных линейных
моделей при принятии реш ений..................................................... 447
29. Ж изнеспособность мифических чисел.......................................... 466
30. Интуитивное прогнозирование: предубеждения и коррек­
тирующие процедуры....................................................................... 473
31. Освобождение от предубеждения................................................... 482

32. Улучшение индуктивного вывода................................................. 508

Часть IX: Восприятие риска................................................................... 527


33. Ф акты против страха: понимание воспринимаемого
риска........................................................................................................... ^29

као
Часть X: Поскриптум...............................................................................
34. К вопросу о статистической интуиции........................................... 565
35. Варианты неопределенности........................................................... 582

Л итература................................................................................................ 595
Предисловие научного редактора

В предлагаемой Вашему вниманию книге изложены результаты размышлений и


экспериментальных исследований зарубежных ученых, малоизвестные русско­
язычному читателю.
Речь идет об особенностях мышления и поведения людей при оценке и прогно­
зировании неопределенных событий и величин, таких как, в частности, шансы на
выигрыш или заболевание, предпочтения на выборах, оценка профпригодности,
экспертиза аварийности и многое другое.
Как убедительно показано в книге, принимая решения в неопределенных усло­
виях, люди обычно ошибаются, иногда весьма значительно, даж е если они изуча­
ли теорию вероятности и статистику. Эти ошибки подчинены определенным пси­
хологическим закономерностям, которые выявлены и хорошо экспериментально
обоснованы исследователями.
Надо сказать, что не только закономерные ошибки человеческих решений в си­
туации неопределенности, но и сама организация экспериментов, выявляющих эти
закономерные ошибки весьма интересна и практически полезна.
Можно с уверенностью думать, что перевод этой книги будет интересен и поле­
зен не только отечественным психологам, врачам, политикам, разного рода экс­
пертам, но и многим другим людям, так или иначе связанным с оценкой и прогно­
зом по сути случайных социальных и личных событий.

Научный редактор ,
доктор психологических наук ,
профессор СПбГУ
Г £ . Суходольский ,
Санкт-Петербург , 2004 г .
Предисловие авторов

П одход к процессу принятия решений, представленный в данной книге, основыва­


ется на трех направлениях исследований, получивших развитие в 50-х и 60-х го­
дах X X столетия. Например, сравнение клинического и статистического прогно­
зирования, начатое Паулем Милом (Paul Meehl); изучение субъективной вероятно­
сти в парадигме Байеса (Bayes), представленное в психологии Бардом Эдвардсом
(Ward Edwards); и исследование эвристики и стратегий рассуждения, представлен­
ной Гербертом Саймоном (Herbert Simon) и Джеромом Брунером (Jerome Bruner).
Наш сборник также включает современную теорию, находящуюся на стыке про­
цесса принятия решений с другой отраслью психологического исследования: изу­
чением причинной атрибуции и бытовой психологической интерпретации, впер­
вые представленной Фрицом Хайдером (Fritz Heider).
Классическая книга Мила, изданная в 1954, подтверждает тот факт, что про­
стые линейные комбинации высказываний превосходят интуитивные суждения
экспертов в предсказании существенных поведенческих критериев. Не теряющее
актуальности и сегодня интеллектуальное наследие этой работы, и шумная поле­
мика, последовавшая за ней, вероятно, не доказывали, что клиницисты плохо спра­
вились со своей работой, за которую, как отмечал Мил, им и не стоило бы браться.
Скорее, это была демонстрация существенного несоответствия между объективны­
ми показателями успеха людей в задачах предсказания и их искренним убеж дени­
ем о собственной продуктивности. Это заключение верно не только для клиницис­
тов и клинических прогнозов: мнения людей о том, как они делают выводы и то,
насколько хорошо они это делают, не могут быть приняты в качестве основания.
Ведь исследователи, практикующие клинический подход часто использовали са­
мих себя или своих друзей в качестве испытуемых, а интерпретация ошибок и от­
клонений были скорее когнитивными, чем психодинамическими: в качестве моде­
ли использовались скорее впечатления об ошибках, чем действительные ошибки.
С момента привлечения Эдвардсом и его коллегами идей Байеса в психологи­
ческое исследование, пенологам впервые предложили целостную и четко сформу­
лированную модель оптимального поведения в условиях неопределенности, с ко­
торой можно было сравнить принятие решений человеком. Соответствие приня­
тия решений нормативным моделям стало одной из главных парадигм исследова-
ни я в области суж дения в условиях неопределенности« Это неизбежно затрагивало
проблему предубеждений, к которым люди тяготеют при индуктивных выводах, и
методов, которые могли бы использоваться для их коррекции. Эти проблемы рас­
сматриваются в большинстве разделов этого издания. Однако во многих ранних
работах использовалась нормативная модель для объяснения человеческого пове­
дения, а такж е вводились дополнительные процессы для объяснения отклонений
от оптимальных показателей. Напротив, целью исследования в области эвристик в
принятии решений является объяснение как правильных, так и ошибочных суж ­
дений в терминах одних и тех ж е психологических процессов.
Появление такой новой парадигмы, как когнитивная психология, оказало се­
рьезное влияние на исследование принятия решений. Когнитивная психология
рассматривает внутренние процессы, ментальные ограничения, и то, как именно
ограничения влияют на эти процессы. Ранними примерами концептуальной и эм­
пирической работы в этой области являлись исследование стратегий мышления
Брунера и его коллег, а такж е трактовка эвристик рассуждений и ограниченной
рациональности Саймона. И Брунер, и Саймон занимались стратегиями упрощ е­
ния, которые уменьшают сложность задач принятия решений для того, чтобы сде­
лать их приемлемыми для образа мышления людей. Мы включили в эту книгу боль­
шинство работ, исходя из подобных соображений.
В течение последних лет большой объем исследований был посвящен эвристи­
кам суж дений, а также исследованию их эффектов. Данное издание комплексно
рассматривает этой подход. В нем собраны новые работы, написанные специально
для этого сборника, и уж е изданные статьи по вопросам суждений и предположе­
ний. Хотя граница меж ду суждением и принятием решения не всегда ясна, мы со­
средоточились здесь скорее на суж дении, чем на выборе. Тема принятия решения
достаточно важна для того, чтобы быть предметом отдельного издания.
Книга состоит из десяти частей. Первая часть содержит ранние исследования
эвристики и стереотипов при интуитивном принятии решений. В части II специ­
ально рассмотрена эвристика репрезентативности, которая, в части III, расширена
до проблем причинной атрибуции. Часть IV описывает эвристику доступности и ее
роль в социальном суж дении. Часть V рассматривает понимание и изучение кова­
риации, а такж е показывает наличие иллюзорных корреляций в принятии реш е­
ний обычными людьми и специалистами. В части VI обсуждается проверка вероят­
ностных оценок и обосновывается распространенное явление самоуверенности в
прогнозировании и объяснении. Предубеждения, связанные с многоступенчатым
выводом рассматриваются в части VII. Часть VIII рассматривает формальные и не­
формальные процедуры для коррекции и улучшения интуитивного принятия ре­
шений. Часть IX суммирует изучение последствий стереотипов при принятии ре­
шений в области риска. Заключительная часть содержит некоторые современные
мысли по поводу нескольких концептуальных и методологических проблем по изу­
чению эвристики и предубеждений.
Для удобства все ссылки собраны в отдельном списке в конце книги. Номера,
напечатанные жирным шрифтом, относятся к материалу, включенному в книгу,
обозначая главу, в которой данный материал появляется. Мы использовали скоб­
ки (...) чтобы указать на удаленный материал из предварительно изданных статей.
Наша работа по подготовке этой книги была поддержана Службой военно-морс­
ких исследований, Грант N00014-79-C-0077 Стэнфордскому Университету и Служ­
бой военно-морских исследований, Контракт N0014-80-C-0150 по исследованию при­
нятия решений.
Мы хотим поблагодарить Пэгги Рокер, Нэнси Коллинс, Джерри Хенсона и Дона
МакГрегора за их помощь в подготовке этой книги.

Даниелъ Канеман
Пол Словик
Амос Теерски
Часть I
Введение
1. Принятие решений в условиях неопределен­
ности: правила и предубеждения*

Амос Тверски и Даниелъ Канеман

Многие реш ения основаны на убеж дениях о вероятности неопределенных


событий, таких к ак , например, результат выборов, вина ответчика в суде
или будущий курса доллара. Эти убеж дения обычно вы раж аю тся в заявле­
ниях типа “ я думаю, что... “, “ вероятность такова... “, “маловероятно, что... ”
и т.д. И ногда убеждения относительно неопределенных событий вы раж е­
ны в численной форме к ак ш ансы или субъективные вероятности. Что оп­
ределяет такие убеждения? К ак люди оцениваю т вероятность неопределен­
ного события или значения неопределенной величины ? Этот раздел пока­
зы вает, что люди полагаю тся на ограниченное число эвристических прин­
ципов, которые сводят сложные задачи оценки вероятностей и прогнозиро­
вания значений величин до более простых операций суж дения. Вообще, эти
эвристики весьма полезны, но иногда они ведут к серьезным и системати­
ческим ош ибкам.
Субъективная оценка вероятности похож а на субъективную оценку фи­
зических величин, таких к ак расстояние или размер. Все эти оценки осно­
ваны на данны х ограниченной достоверности, которые обработаны соглас­
но правилам эвристики. Н априм ер, предполож ительное расстояние до
объекта частично определяется его четкостью . Чем резче объект, тем ближе
он каж ется. Это правило имеет некоторое обоснование, потому что на любой
местности более удаленные объекты каж утся менее четкими, чем более близ­
кие объекты. Однако постоянное следование этому правилу ведет к систе­
матическим ош ибкам в оценке расстояния. Х арактерно, что при плохой
видимости расстояния часто переоцениваю тся, потому что контуры объек­
тов размы ты . С другой стороны, расстояния часто недооцениваются, когда
видимость хорош ая, потому что объекты каж утся более четкими. Таким
образом, использование четкости в качестве показателя расстояния ведет к
распространенным предубеждениям. Такие предубеждения такж е можно

*Эта глава впервые появилась в Science, 1974,185,1124-1131. Авторское право© 1974 при­
надлежит Американской Ассоциации достижений науки. Переиздано в соответствии с раз­
решением.
18 ВВЕДЕНИЕ
обнаруж ить в интуитивной оценке вероятности. В этой книге описываются
три вида эвристик, которые использую тся для оценки вероятности и про­
гнозирования значений величин. П риводятся предубеждения, к которым
ведут эти эвристики, а такж е обсуждается практическое и теоретическое
значение этих наблюдений.

Реп резен тативн ость


Больш инство вопросов о вероятности принадлеж ат к одному из следующих
типов: К акова вероятность того, что объект А принадлеж ит классу В? К ако­
ва вероятность, что причиной события А является процесс В? К акова веро­
ятность, что процесс В приведет к событию А? Отвечая на такие вопросы,
люди обычно полагаю тся на эвристику репрезентативности, в которой ве­
роятность определяется степенью, в которой А репрезентативно по отнош е­
нию к В, то есть степенью, в которой А похоже на В. Н апример, когда А в
высокой мере репрезентативно В, вероятность того, что событие А происхо­
дит из В, оценивается к ак вы сокая. С другой стороны, если А не похоже на
В, то вероятность оценивается как низкая.
Д ля иллю страции суждения репрезентативности, рассмотрим описание
человека его бывшим соседом: “Стив очень замкнутый и застенчивый, всегда
готов мне помочь, но слиш ком мало интересуется другими людьми и реаль­
ностью вообще. Он очень кроткий и опрятный, любит порядок и системати­
зированное ть, а такж е склонен к детализации. ” К ак люди оценивают вероят­
ность того, кто Стив по профессии (например, фермер, продавец, пилот само­
лета, библиотекарь или врач)? К аким образом люди располагают эти профес­
сии от наиболее до наименее вероятной? В эвристике репрезентативности, ве­
роятность того, что Стив - библиотекарь, например, определяется степенью,
в которой он репрезентативен библиотекарю, или соответствует стереотипу
библиотекаря. Действительно, исследование подобных проблем показало, что
люди распределяют профессии точно таким ж е образом (Kahnem an и Tversky,
1973,4). Этот подход к оценке вероятности приводит к серьезным ошибкам,
потому что на подобие или репрезентативность не оказывают влияние отдель­
ные ф акторы , которые должны влиять на оценку вероятности.

Н ечувст вит ельност ь к априорной вероятности результ ат а


Одним из ф акторов, которые не оказы ваю т влияния на репрезентатив­
ность, но значительно влияю т на вероятность — является предш ествующ ая
вероятность, или частота базовых значений результатов (исходов). В слу­
чае Стива, например, тот ф акт, что среди населения намного больше ферме­
ров, чем библиотекарей, обязательно принимается в расчет при любой р а­
зумной оценке вероятности того, что Стив скорее является библиотекарем,
чем фермером. П ринятие во внимание частоты базовых значений, однако, в
действительности не влияет н а соответствие Стива стереотипу библиотека­
Принятие решений в условиях неопределенности 19
рей и фермеров. Если люди оценивают вероятность посредством репрезен­
тативности, следовательно, предш ествующ ими вероятностями они будут
пренебрегать. Эта гипотеза была проверена в эксперименте, в котором и з­
м енялись предш ествующ ие вероятности (K ahnem an и T versky, 1973, 4).
Испытуемым показы вали краткие описания нескольких людей, выбранных
наугад из группы 100 специалистов - инженеров и адвокатов. Тестируемых
просили оценить, для каж дого описания, вероятность того, что оно принад­
леж ит скорее инж енеру, чем адвокату. В одном экспериментальном случае,
испытуемым сообщалось, что группа, описания из которой были даны , со­
стоит из 70 инженеров и 30 адвокатов. В другом случае испытуемым сооб­
щ алось, что группа состоит из 30 инженеров и 70 адвокатов. Ш ансы того,
что каж дое отдельное описание принадлеж ит скорее инж енеру, чем адво­
кату, долж на быть выш е в первом случае, где большинство инженеров, чем
во втором, где большинство адвокатов. Это можно показать, прим еняя пра­
вило Байеса заклю чаю щ ееся в том, что пропорция этих шансов должна быть
(0 .7 /0 .3 )2, или 5.44, для каж дого описания. Грубо наруш ая правило Байе­
са, испытуемые в обоих случаях, продемонстрировали, в сущности, одина­
ковы е оценки вероятности. Очевидно, участники эксперимента оценили ве­
роятность того, что конкретное описание принадлеж ит скорее инженеру,
чем адвокату как степень, в которой это описание было репрезентативно этим
двум стереотипам, мало учиты вая, если учиты вая вообще, предшествую­
щ ие вероятности этих категорий.
Испытуемые правильно использовали предш ествующ ие вероятности,
когда они не обладали иной информацией. В отсутствии краткого описания
личности, они оценивали вероятность того, что неизвестный человек я в л я­
ется инженером, к ак 0.7 и 0.3, соответственно, в обоих случаях, при обоих
условиях частоты базовых значений. Однако предш ествующ ие вероятнос­
ти полностью игнорировались, когда было представлено описание, даже если
оно было полностью неинформативно. Реакции на нижеизлож енное описа­
ние иллю стрирую т это явление:
Дик - 30-летний мужчина. Женат, еще не имеет детей. Очень способный и мотивиро­
ванный сотрудник, подает большие надежды. Пользуется признанием коллег.

Это описание было задумано таким образом, чтобы не предоставить инфор­


мации о том, является ли Д ик инженером или адвокатом. Следовательно,
вероятность того, что Д ик является инженером, долж на равняться пропор­
ции инженеров в группе, к ак если бы не было дано описания вовсе. И спыту­
емые, однако, оценили вероятность того, что Д ик является инженером, к а к
5 независимо от того, к ак ая дана пропорция инженеров в группе (7 к 3 или 3
к 7). Очевидно, что люди реагирую т по-разному в ситуациях, когда описа­
ние отсутствует и когда дано бесполезное описание. В случае, когда описа­
ния отсутствуют, предш ествующ ие вероятности использую тся долж ны м
образом; и предшествующие вероятности игнорирую тся, когда дается бес­
полезное описание (K ahnem an и Tversky, 1973,4).
20 ВВЕДЕНИЕ
Н ечувст вит ельност ь к размеру выборки
Чтобы оценивать вероятность получения конкретного результата в выбор­
ке, отобранной из указанной совокупности, люди обычно применяю т эври­
стику репрезентативности. То есть они оценивают вероятность результата в
выборке, например, то, что средняя высота в случайной выборке из десяти
человек будет б футов (180 сантиметров), в степени в какой этот результат
подобен соответствующему параметру (то есть средней высоте людей среди
всего населения). Подобие статистики в выборке типичному параметру у
всего населения не зависит от размера выборки. Следовательно, если веро­
ятность рассчиты вается с помощью репрезентативности, то статистическая
вероятность в выборке будет по сущ еству независима от размера выборки.
Действительно, когда тестируемые оценивали распределение средней вы ­
соты для выборок различны х размеров, они производили идентичные рас­
пределения. Н апример, вероятность получения средней высоты более чем 6
футов (180 см) бы ла оценена подобной для выборок 1 .0 0 0 ,1 0 0 и 10 человек
(K ahnem an и Tversky, 1972b, 3). Кроме того, испытуемые не сумели оце­
нить роль размера выборки даж е, когда это было подчеркнуто в формули­
ровке проблемы. Приведем пример, подтверждающ ий это.
Некоторый город обслуживается двумя больницами. В большей по размеру больнице
рождаются приблизительно 45 младенцев каждый день, а в меньшей больнице, при­
близительно 15 младенцев каждый день. Как Вы знаете, приблизительно 50% от всех
младенцев - мальчики. Однако точный процент меняется со дня на день. Иногда он
может быть выше, чем 50%, иногда ниже.
В течение одного года, каждая больница делала учет тех дней, когда больше чем 60%
рожденных младенцев были мальчиками. Какая больница, по вашему мнению, сдела­
ла учет большего количества таких дней?
Большая по размеру больница (21)
Меньшая больница (21)
Примерно поровну (то есть в пределах разницы в 5%) (53)

Ч исла в круглы х скобках указы ваю т количество отвечавш их студентов пос­


ледних курсов.
Больш инство тестируемых оценивало вероятность того, что будет более
60% мальчиков в равной степени и в маленькой, и в большой больнице, воз­
можно, потому что эти события описаны одинаковой статистикой и, таким
образом, одинаково репрезентативны по отношению ко всему населению.
Напротив, согласно теории выборок, ожидаемое число дней, в которые боль­
ш е чем 60% рожденных младенцев являю тся мальчиками, намного выше в
маленькой больнице, чем в большой, потому что для большой выборки менее
вероятно, отклонение от 50% . Это фундаментальное понятие статистики, оче­
видно, не является частью интуиции людей.
Подобная нечувствительность к размеру выборки была зафиксирована в
оценках апостериорной (posteriori) вероятности, то есть вероятности, что
вы борка была отобрана скорее из одной совокупности, чем из другой. Рас-
Принятие решений в условиях неопределенности 21
смотрим следующий пример:
Вообразите корзину, наполненную шарами, из которых 2 /3 одного цвета и 1/3 другого.
Один человек вынимает из корзины 5 шаров и обнаруживает, что 4 из них красные, а 1 -
белый. Другой человек вынимает 20 шаров и обнаруживает, что 12 из них красные, а 8 -
белые. Который из этих двух людей должен с большей уверенностью сказать, что в кор­
зине скорее 2 /3 красных шаров и 1/3 белых шаров, чем наоборот? Каковы шансы у
каждого из этих людей?

В этом примере, правильны м ответом является оценка последующ их


ш ансов к ак 8 к 1 для выборки 4:1 и 16 к 1 для выборки 12:8, при условии,
что предш ествующ ие вероятности равны . Однако большинство людей ду­
мает, что первая вы борка обеспечивает намного более серьезное подтверж ­
дение для гипотезы , что корзина наполнена в основном красны ми ш арами,
потому что процентное отношение красны х ш аров в первой выборке боль­
ш е, чем во второй. Это снова показы вает, что интуитивные оценки превали­
руют за счет пропорции выборки, а не ее размера, который играет реш аю ­
щую роль в определении реальны х последую щ их ш ансов. (K ahnem an и
Tversky, 1972b). Кроме того, интуитивны е оценки последующ их шансов
(posterior odds) гораздо менее радикальны , чем правильны е значения. В
проблемах этого типа неоднократно наблюдалась недооценка влияния оче­
видного (W . Edw ards, 1968, 25; Slovic и L ichtenstein, 1971). Этот феномен
назван «консерватизмом ».

Ошибочные концепции шанса


Люди полагаю т, что последовательность событий, организованная к ак слу­
чайны й процесс представляет существенную характеристику этого процес­
са даж е, когда последовательность короткая. Н апример, относительно вы ­
падения монеты «орлом» или «реш кой», люди считаю т, что последователь­
ность О-Р-О-Р-Р-О, более вероятна, чем последовательность О-О-О-Р-Р-Р,
которая не каж ется случайной, а такж е более вероятна, чем последователь­
ность О-О-О-О-Р-О, которая не отраж ает равнозначность сторон монеты
(K ahnem an и Tversky, 1972b, 3). Таким образом, люди ожидаю т, что сущ е­
ственные характеристики процесса будут представлены, не только глобаль­
но, т.е. в полной последовательности, но такж е и локально - в каж дой из ее
частей. Однако локально репрезентативная последовательность системати­
чески отклоняется от ож идания ш ансов, на которые рассчитывали: в ней
слиш ком много чередований и слиш ком мало повторений. Другое послед­
ствие убеждения по поводу репрезентативности — хорошо известная ошиб­
ка игрока в казино. Видя, что красны е слиш ком долго выпадаю т на колесе
рулетки, например больш инство лю дей, ошибочно полагает, что, скорее
всего, теперь должно вы пасть черное, потому что выпадение черного завер­
ш ит более репрезентативную последовательность, чем выпадение еще од­
ного красного. Ш анс обычно рассматривается к а к саморегулирую щ ийся
22 ВВЕДЕНИЕ
процесс, в котором отклонение в одном направлении приводит к отклоне­
нию в противоположном направлении с целью восстановления равновесия.
Н а самом деле отклонения не исправляю тся, а просто «растворяются» по
мере протекания случайного процесса.
Неправильные представления о шансе характерны не только для неопыт­
ны х тестируемых. Изучение интуиции в статистических предположениях у
опытных психологов-теоретиков (Tversky и Kahnem an, 1971,2) показало ус­
тойчивое верование в то, что можно назвать законом малых чисел, согласно
которому даж е маленькие выборки являю тся высоко репрезентативными по
отношению к совокупностям, из которых они отобраны. Результаты этих ис­
следователей отразили ожидание того, что гипотеза, достоверная относительно
всей совокупности, будет представлена к ак статистически значимый резуль­
тат в выборке, причем размер выборки не имеет значения. К ак следствие,
специалисты слиш ком верят в результаты , полученные на маленьких выбор­
ках, и слиш ком переоценивают повторяемость этих результатов. П ри прове­
дении исследования, это предубеждение ведет к отбору выборок неадекват­
ного размера и к преувеличенной интерпретации результатов.

Н ечувст вит ельност ь к надежности прогноза


Люди иногда вынуж дены делать числовые предсказания, такие к ак буду­
щ ий курс акции, спрос на товар или результат футбольной игры. Такие пред­
сказани я основываются на репрезентативности. Н апример, предположим,
некто получил описание компании, и его просят предсказать ее будущую
прибы ль. Если описание компании очень благоприятно, то по этому описа­
нию наиболее репрезентативной будет казаться очень высокая прибыль; если
описание посредственно - то наиболее репрезентативным будет казаться за­
урядное развитие событий. То, насколько описание является благоприят­
ны м, не зависит от достоверности этого описания или степени, в которой
оно позволяет проводить точное прогнозирование.
Следовательно, если люди делают прогноз, исходя исклю чительно из
благоприятности описания, их предсказания будут нечувствительны к н а­
дежности описания и к ожидаемой точности предсказания.
Этот способ делать суж дения наруш ает нормативную статистическую
теорию, в которой экстремум и диапазон предсказаний зависит от предска­
зуемости. Когда предсказуемость равна нулю, во всех случаях должно быть
сделано одно и то ж е предсказание. Н апример, если описания компаний не
содерж ат инф ормации относительно прибыли, тогда для всех компаний
долж на быть спрогнозирована одна и та ж е величина (в размере среднего
значения прибыли). Если прогнозируемость идеальна, конечно, предсказы ­
ваемы е величины будут соответствовать ф актическим величинам, и диапа­
зон прогнозов будет равняться диапазону результатов. Вообще, чем выш е
предсказуемость, тем ш ире диапазон предсказанных величин.
Н екоторы е исследования численного прогнозирования показали, что
Принятие решений в условиях неопределенности 23
интуитивные предсказания наруш аю т это правило, и что испытуемые мало
учиты ваю т, если учиты ваю т вообщ е, соображ ения прогнозируем ости
(K ahnem an и T versky, 1973,4). В одном из этих исследований, испытуемым
было предоставлено несколько абзацев текста, каж ды й из которых описы­
вал работу преподавателя ВУЗа в течение отдельно взятого практического
занятия. Н екоторых тестируемых попросили оценить качество урока, опи­
санного в тексте с помощью процентной ш калы , относительно указанной
совокупности. Других тестируемых просили спрогнозировать, такж е ис­
пользуя процентную ш калу, положение каж дого преподавателя ВУЗа че­
рез 5 лет после этого практического занятия. Суждения, сделанные при обо­
их условиях были идентичными. То есть предсказание отдаленного во вре­
мени критерия (успех преподавателя через 5 лет) было идентично оценке
информации, на основе которой это предсказание было сделано (качество
практического занятия). Студенты, которые предположили это, несомнен­
но, знали о том, насколько ограничена прогнозируемоеть компетентности
преподавателя, основанная на единственном пробном уроке, проведенного
5 годами ранее; однако их прогнозы были столь ж е крайним и, сколь и их
оценки.

И ллю зи я валидност и
К ак мы уж е говорили, люди часто делают прогнозы, вы бирая исход (напри­
мер, профессию), которы й является наиболее репрезентативным по отно­
шению к входным данным (например, описание человека). То, насколько
они уверены в своем прогнозе, зависит, прежде всего, от степени репрезен­
тативности (то есть качества соответствия выбора входным данным) безот­
носительно факторов, которые ограничиваю т точность их прогноза. Таким
образом, люди вполне уверены в прогнозе, что человек является библиоте­
карем, когда дано описание его личности, которое соответствует стереотипу
библиотекаря, даж е если оно скудно, ненадежно или устарело. Необосно­
ванная уверенность, которая является следствием удачного совпадения
предсказываемого результата и входных данны х, мож ет назы ваться иллю­
зией валидности. Эта иллю зия сохраняется даже тогда, когда испытуемый
знает факторы , которые ограничиваю т точность его прогнозов. Вполне рас­
пространенным является вы сказы вание, что психологи, которые проводят
выборочные интервью , часто обладают значительной уверенностью по по­
воду своих прогнозов, даж е если они знакомы с обширной литературой, ко­
торая показы вает что в выборочных интервью вы сока вероятность ошибок.
П родолжительная уверенность в правильности результатов клинического
выборочного интервью , несмотря на повторные свидетельства его неадек­
ватности, является достаточным свидетельством силы этого эффекта.
Внутренняя согласованность образца входных данных является основным
показателем степени уверенности в прогнозе, основанном на этих входных
данных. Например, люди выражаю т больше уверенности в прогнозе средне­
24 ВВЕДЕНИЕ
го балла успеваемости студента, чей табель за первый год обучения состоит
полностью из В (4 балла), чем в прогнозе среднего балла студента, в чьем табе­
ле за первый год обучения много оценок, как А (5 баллов), так и С (3 балла).
Высоко согласованные образцы наиболее часто наблюдаются, когда входные
переменные очень избыточны или взаимосвязаны . Следовательно, люди
склонны быть уверенными в прогнозах, основанных на избыточных входных
переменных. Однако элементарное правило в статистике корреляции, утвер­
ж дает, что, если у нас есть входные переменные определенной валидности,
прогноз, основанный на нескольких таких входных данных, может дости­
гать более высокой точности, когда переменные независимы друг от друга,
чем если они являю тся избыточными или взаимосвязанными. Таким обра­
зом, избыточность входных данных уменьшает точность, даж е если она уве­
личивает уверенность, таким образом, люди часто уверены в прогнозах, ко­
торые, скорее всего, будут ошибочными (K ahnem an и Tversky, 1973,4).

Н еправильны е предст авления о регрессии


П редположим, что больш ая группа детей была протестирована с помощью
двух подобных версий теста на способности. Если некто отберет десять де­
тей из числа тех, кто справился лучш е всех с одной из этих двух версий, он
обычно будет разочарован выполнением ими второй версии теста. И напро­
тив, если некто отберет десять детей из числа тех, кто хуж е всех справился
с первой версией теста, то в среднем он обнаружит, что с другой версией они
справились несколько лучш е. Обобщая, рассмотрим две переменные X и Y,
которы е имеют одинаковое распределение. Если выбрать людей, чьи сред­
ние X оценки отклоняю тся от среднего X на к единиц, тогда среднее от их Y
ш калы будет обычно отклоняться от среднего Y меньш е чем на к единиц.
Эти наблю дения иллюстрируют общее явление известное к ак регресс к сред­
нему, которое было открыто Гальтоном более чем 100 лет назад.
В обычной ж изни все мы сталкиваем ся с большим количеством случаев
регресса к среднему, сравнивая, например, рост отцов и сыновей, уровень
интеллекта мужей и ж ен, или результаты сдачи экзаменов, следующих один
за другим. Тем не менее, у людей отсутствуют предполож ения по этому по­
воду. Во-первых, они не ожидаю т регрессии во многих контекстах, где она
долж на произойти. Во-вторых, когда они признаю т возникновение регрес­
сии, они часто изобретаю т неверны е объяснения причин. (K ahnem an и
Tversky, 1973,4). Мы полагаем, что явление регресса остается неуловимым,
потому что оно несовместимо с мнением о том, что прогнозируемый резуль­
тат долж ен быть максимально репрезентативен по отношению к входным
данны м, и, следовательно, значение переменной результата должно быть
настолько ж е крайним , к ак и значение входной переменной.
Неспособность признать смысл регрессии может иметь пагубные послед­
ствия, к ак было проиллюстрировано в следующих наблюдениях (Kahnem an
Принятие решений в условиях неопределенности 25
и Tversky, 1973,4). При обсуждении учебных полетов, опытные инструкто­
ры отметили, что похвала за исключительно мягкое приземление обычно при
следующей попытке сопровождается более неудачным приземлением, в то
время к ак резкая критика после жесткого приземления обычно сопровожда­
ется улучшением результатов при следующей попытке. Инструкторы сдела­
ли вывод, что словесные поощ рения вредны для обучения, в то время к ак вы­
говоры приносят пользу, вопреки принятой психологической доктрине. Это
заклю чение несостоятельно из-за присутствия регресса к среднему. К ак и в
других случаях, когда экзамены следуют один за другим, улучшение обычно
следует за плохим выполнением работы, а ухудшение - за отлично проделан­
ной работой, даж е если преподаватель или инструктор никак не реагирует на
достижения учащ егося при первой попытке. Поскольку инструкторы похва­
лили своих учеников после хороших приземлений и поругали их после пло­
хих, они приш ли к ошибочному и потенциально вредному заключению, что
наказание является более эффективным, чем награда.
Таким образом, неспособность понимать эффект регрессии ведет, к тому,
что эффективность наказан и я оценивается слиш ком высоко, а эффектив­
ность награды недооценивается. В социальном взаимодействии, такж е, к ак
и в обучении, награда обычно прим еняется, когда работа выполнена хоро­
шо, и наказание, когда работа выполнена плохо. Следуя только закону рег­
рессии, поведение, вероятней всего, улучш ится после наказания и , скорее
всего, ухудш ится после награды . Следовательно, выходит так, что, по чис­
той случайности, людей поощ ряю т за то, что они наказы ваю т других, и на­
казываю т за их поощрение. Лю ди, в целом, не знаю т об этом обстоятель­
стве. Ф актически, неуловимая роль регрессии в определении очевидных
последствий награды и н аказания, каж ется, ускользнула от вним ания уче­
ны х, работаю щ их в этой области.

Доступность
Бывают ситуации, в которы х люди оцениваю т частоту класса или вероят­
ность событий на основе легкости, с которой они вспоминают примеры слу­
чаев или события. Н апример, можно оценивать вероятность риска сердеч­
ного приступа среди людей средних лет, вспоминая такие случаи среди сво­
их знакомы х. П охожим образом некто может оценивать вероятность того,
что некоторое бизнес-предприятие потерпит неудачу, представляя себе раз­
личные трудности, с которыми оно могло бы столкнуться. Эта эвристика
оценки назы вается доступностью. Доступность очень полезна для оценки
частоты или вероятности событий, потому что события, принадлеж ащ ие
большим классам , обычно вспоминаю тся и быстрее, чем случаи менее час­
тых классов. Однако на доступность воздействуют и другие факторы , кроме
частоты и вероятности. Следовательно, уверенность относительно доступ­
ности ведет к вполне прогнозируемым предубеждениям, некоторые из ко­
торых проиллю стрированы ниж е.
26 ВВЕДЕНИЕ
Предубеж дения, обусловленные степенью восст анавливаемост и
событий в пам ят и
Когда размер класса оценивается на основе доступности его элементов, класс,
элементы которого легко восстанавливаю тся в пам яти, будет казаться бо­
лее многочисленным, чем класс такого ж е размера, но элементы которого,
менее доступны и хуж е вспоминаются. При простой демонстрации этого эф­
ф екта, испытуемым зачитали список известных людей обоих полов, и за­
тем попросили оценить, было ли в списке больше м уж ских имен, чем ж енс­
ких. Различны е списки были предоставлены разны м группам тестируемых.
В некоторых из списков муж чины были более известны, чем ж енщ ины , а в
других, ж енщ ины были более известны, чем муж чины . В каж дом из спис­
ков, испытуемые ошибочно считали, что класс (в данном случае пол), в к о­
тором были более известные люди, был более многочисленным (Tversky и
K ahnem an, 1973,11).
В дополнение к узнаваемости, имеются другие факторы , такие к ак яр ­
кость, которая влияет на восстанавливаемость событий в пам яти. Н апри­
мер, если человек наблюдал воочию пож ар в здании, то он будет считать
возникновение таких несчастных случаев, наверное, более субъективно ве­
роятны м, чем, если бы, он прочитал об этом пож аре в местной газете. Кроме
того, недавние происш ествия, вероятно, будут вспоминаться несколько про­
щ е, чем более ранние. Часто бывает, что субъективная оценка вероятности
возникновения дорожных происш ествий временно повыш ается, когда че­
ловек видит около дороги перевернутый автомобиль.

Предубеж дения, обусловленны е эфф ект ивност ью н а п р а влен и я


поиска
П редположим, из английского текста наугад выбрано слово (из трех букв
илиболы пе). Что является более вероятным, то, что слово начинается с бук­
вы г или что г является третьей буквой? Люди подходят к решению этой
проблемы, вспоминая слова, которые начинаю тся с г (road - дорога), и сло­
ва, которы е имеют г в третьей позиции (саг - автомобиль), и оцениваю т от­
носительную частоту, основываясь на легкости, с которой слова этих двух
типов приходят на ум. П оскольку гораздо легче искать слова по первой бук­
ве, чем по третьей, большинство людей считаю т, что больше слов, которые
начинаю тся с этой согласной, чем слов, в которых тот ж е самый согласный
появляется в третьей позиции. Они делают такой вывод даже для таких со­
гласны х, к ак г или к, которые чащ е появляю тся в третьей позиции, чем в
первой (Tversky и K ahnem an, 1973,11).
Различны е задачи требуют различны х направлений поиска. Н апример,
предположим, Вас попросили оценить частоту, с которой слова с абстракт­
ным значением (мысль, любовь) и конкретны м значением (дверь, вода) по­
являю тся в письменном английском язы ке. Естественный способ ответить
Принятие решений в условиях неопределенности 27
на этот вопрос - найти контексты , в которых эти слова могли бы появлять­
ся. К аж ется, легче вспомнить контексты , в которых может быть упомянуто
абстрактное значение (любовь в ж енских романах), чем вспомнить контек­
сты , в которы х упоминается слово с конкретны м значением (например,
дверь). Если частота слов определяется на основании доступности контек­
стов, в которы х они появляю тся, слова с абстрактным значением, будут
оценены к ак относительно более многочисленные, чем слова с конкретным
значением. Этот стереотип наблю дался в недавнем исследовании (G albraith
и U nderwood, 1973), которое показало, что частота возникновения слов с
абстрактным значением бы ла намного выш е частоты слов с конкретны м
значением, в то время к ак их объективная частота равна. Оценивалось так ­
ж е, что абстрактные слова появлялись в намного большем разнообразии
контекстов, чем слова с конкретны м значением.

Предубеж дения, обусловленны е способностью к предст авлению


образов
И ногда нужно оценить частоту класса, элементы которого не хранятся в
пам яти, а могут быть созданы согласно определенному правилу. В таких
ситуациях, обычно воспроизводятся некоторые элементы, а частота или
вероятность оценивается той легкостью , с которой могут быть построены
соответствующие элементы. Однако легкость воспроизведения соответству­
ющ их элементов не всегда отраж ает их фактическую частоту, и этот способ
оценки приводит к предубеждениям. Д ля иллю страции этого рассмотрим
группу из 10 человек, которые формируют комитеты , состоящие из ft чле­
нов, причем 2 < ft < 8. Сколько различны х комитетов, состоящ их из ft чле­
нов может быть сформировано? П равильны й ответ на эту проблему дается
биноминальным коэффициентом ( k 10), который достигает максимума, рав­
ного 252 для ft = 5. Ясно, что число комитетов, состоящ их из ft членов, рав­
няется числу комитетов, состоящ их из (10 - ft) членов, потому что для любо­
го комитета, состоящего из ft членов, существует единственно возмож ная
группа, состоящ ая из (10 - ft) человек, не являю щ ихся членами комитета.
Одним из способов ответить без вы числения - это мысленно создать ко­
митеты, состоящ ие из ft членов, и оценить их количество, используя лег­
кость, с которой они приходят на ум. Комитеты, состоящ ие и з небольшого
количества членов, например, 2, более доступны, чем комитеты , состоящ ие
из большого количества членов, например, 8. Самая простая схема созда­
ния комитетов - разделение группы на непересекаю щ иеся множества. Сра­
зу видно, что легче создать пять непересекаю щ ихся комитетов по 2 члена в
каж дом, в то время как невозможно сгенерировать и двух непересекаю щ их­
ся комитетов по 8 членов. Следовательно, если частота оценивается за счет
способности представить это, или доступностью к мысленному воспроизве­
дению, будет казаться, что маленьких комитетов больше, чем больш их, в
отличие от правильной параболической ф ункции. Действительно, когда
28 ВВЕДЕНИЕ
тестируемых-неспециалистов просили оценить число различны х комитетов
разны х размеров, их оценки представляли собой монотонно-убывающую
функцию от размера комитета (Tversky и K ahnem an, 1 9 7 3 ,11). Например,
средняя оценка числа комитетов, состоящ их из 2 членов, была 70, в то вре­
м я к ак оценка для комитетов, состоящ их из 8 членов — 20 (правильный
ответ - 45 в обоих случаях).
Способность представлять образы играет важную роль в оценке вероят­
ностей возникновения реальны х ж изненны х ситуаций. Риск, с которым
связана опасная экспедиция, например, оценивается, посредством мыслен­
ного воспроизведения непредвиденных обстоятельств, для преодоления ко­
торы х у экспедиции нет достаточного оборудования. Если многие из таких
трудностей ярко изображаю тся, экспедиция может показаться чрезвы чай­
но опасной, хотя легкость, с которой воображаются бедствия, вовсе не обя­
зательно отраж ает их фактическую вероятность. Наоборот, если возмож ­
ную опасность трудно вообразить, или она просто не приходит на ум, риск,
связанны й с каким-либо событием, может быть чрезвычайно недооценен.

И ллю зорн ая взаимосвязь


Чепмен и Чепмен (Chapm an and Chapm an, 1969) описали интересное преду­
беждение в оценке частоты, с которой два события произойдут одновремен­
но. Они предоставили испытуемым-неспециалистам информацию относи­
тельно нескольких гипотетических пациентов с психическими расстрой­
ствами. Данные по каж дому пациенту вклю чали клинический диагноз и
рисунки пациента. П озже испытуемые оценили частоту, с которой каж ды й
диагноз (такой к ак паранойя или м ания преследования) сопровождался раз­
личны ми особенностями рисунка (специфической формой глаз). И спытуе­
мые заметно переоценили частоту совместного появления двух естествен­
ны х событий, таких как мания преследования и специфическая форма глаз.
Это явление получило название иллю зорная корреляция. В ош ибочных
оценках представленных данных, испытуемые «заново открыли» многое из
уж е известны х, но необоснованных, клинических знаний относительно ин­
терпретации рисуночного теста. Иллюзорный эффект корреляции был чрез­
вычайно стойкий по отношению к противоречащ им данным. Он сохранил­
ся даж е, когда взаимосвязь между признаком и диагнозом была ф актичес­
ки негативной, что не позволило испытуемым определить действительные
отнош ения меж ду ними.
Доступность является естественным объяснением эффекта иллю зорной
корреляции. О ценка того, насколько часто два явления взаимосвязаны и
происходят одновременно, может быть основано на силе ассоциативной свя­
зи меж ду ними. Когда ассоциация сильна, можно, скорее всего, прийти к
выводу, что события часто происходили одновременно. Следовательно, если
ассоциация меж ду событиями крепкая, то, по оценке людей, они будут час­
то происходить одновременно. Согласно этой точке зрения, иллю зорная кор­
Принятие решений в условиях неопределенности 29
реляция между диагнозом мании преследования и специфической формой
глаз на рисунке, к примеру, появляется из-за того, что м ания преследова­
ния скорее ассоциируется с глазам и, чем с любой другой частью тела.
Продолжительный жизненный опыт научил нас, что, в общем, элементы
больших классов вспоминаются лучш е и быстрее, чем элементы менее час­
тотных классов; что более вероятные события легче вообразить, чем малове­
роятные; и что ассоциативные связи между событиями укрепляю тся, когда
события часто происходят одновременно. В результате, человек получает в
свое распоряжение процедуру (эвристику доступности) для оценки размера
класса, вероятность события, или частота, с которой могут одновременно про­
исходить события, оцениваются той легкостью, с которой могут быть выпол­
нены соответствующие ментальные процессы вспоминания, воспроизведения
или ассоциации. Однако, как показали предшествующие примеры, эти про­
цедуры оценивания систематически приводят к ошибкам.

К орректировка и «привязка» (an ch o rin g )


Во многих ситуациях, люди делают оценки, отталкиваясь от начальной ве­
личины , которая специально подобрана таким образом, чтобы получить
окончательный ответ. Н ачальная величина или отправная точка, может
быть получена посредством формулировки проблемы, или она мож ет быть
частично результатом вы числения. В любом случае, такой «прикидки»
обычно недостаточно (Slovic и L ichtenstein, 1971). То есть, различны е от­
правные точки приводят к различны м оценкам, которые смещены к этим
отправным точкам. Мы называем этот феномен «привязкой» (anchoring).

Недостаточная «корректировка»
Для демонстрации эффекта «привязки », тестируемых просили оценить раз­
личные величины , вы раж енны е в процентах (например, процент А фрикан­
ских стран в О рганизации Объединенных Н аций). Каждой величине с по­
мощью случайного выбора в присутствии тестируемых, был присвоен но­
мер от 0 до 100. Тестируемых вначале попросили указать, больше или мень­
ше этот номер, чем значение самой величины , и затем оценить значение этой
величины, двигаясь в большую или меньшую сторону относительно его но­
мера. Различным группам тестируемых предлагались различные номера для
каждой величины , и эти произвольные номера имели значительное вли я­
ние на оценки тестируемых. Н апример, средние оценки процента А фрикан­
ских стран в О рганизации Объединенных Н аций были 25 и 45 для групп,
которые получили 10 и 65 в качестве отправных точек соответственно. Д е­
нежные вознаграж дения за точность не уменьш али эффект «привязки».
«П ривязка» происходит не только, когда испытуемым задана отправная
точка, но такж е когда испытуемый основывает свою оценку на результате
некоторого неполного вы числения. Изучение интуитивной числовой оцен­
30 ВВЕДЕНИЕ
ки иллю стрирует этот эффект. Две группы студентов средней ш колы оце­
нивали, в течение 5 секунд, значение числового вы раж ения, которое было
написано на доске. Одна группа оценивала значение вы раж ения

8х7х6х5х4хЗх2х1,

в то время как другая группа оценивала значение вы раж ения

1х2хЗх4х5х6х7х8.

Д ля быстрого ответа на такие вопросы, люди могут произвести несколько


ш агов вы числения и оценить значение вы раж ения с помощью экстраполя­
ции или «корректировки». П оскольку «корректировки» обычно недоста­
точно, эта процедура долж на вести к недооценке значения. Более того, так
к ак результат первы х немногих ш агов умнож ения (выполненный слева н а­
право) выш е в убывающей последовательности, чем в возрастаю щ ей, пер­
вое упомянутое вы раж ение должно быть оценено больше последнего. Оба
п редсказан и я бы ли подтверж дены . С редняя оценка д л я возрастаю щ ей
последовательности была 512, в то время к ак средняя оценка для убываю­
щ ей последовательности была 2.2 5 0 . П равильный ответ-4 0 . 320 для обеих
последовательностей.

Предубеж дения в оценке конъю нкт ивны х и дизъю нкт ивны х собы­
т ий
В недавнем исследовании Бар-Х иллел (B ar-H illel, 1973) тестируемым дава­
ли возможность сделать ставку на одно из двух событий. Использовались
три типа событий: (i) простое событие, к ак, например, вы тягивание красно­
го ш ара из м еш ка, содержащ его 50% красны х и 50% белых ш аров; (И) свя­
занное событие, к ак , например, вы тянуть красны й ш ар семь раз подряд из
м еш ка (с возвращ ением ш аров), содержащ его 90% красны х ш аров и 10%
белых; и (ш ) несвязанное событие, к ак, например, вы тянуть красны й ш ар,
по крайней мере, 1 раз в семи последовательных попы тках (с возвращ ением
ш аров) из меш ка, содержащ его 10% красны х ш аров и 90% белых. В этой
проблеме, существенное большинство тестируемых предпочло сделать став­
ку на связанное событие (вероятность которого - 0.48), а не на простое (веро­
ятность которого - 0.50). Испытуемые такж е предпочитал и , ставить скорее
на простое событие, чем на дизъю нктивное, которое имеет вероятность 0.52.
Таким образом, большинство тестируемых сделало ставку на менее вероят­
ное событие при обоих сравнениях. Эти реш ения тестируемых иллю стри­
руют общий вывод: изучение реш ений в азартны х играх и оценки вероят­
ности указы ваю т, что люди имеют тенденцию оценивать слиш ком высоко
вероятность конъю нктивны х событий (Cohen, Chesnick и H ar ап, 1972,24) и
склонны недооценивать вероятность дизъю нктивны х событий. Эти стерео­
Принятие решений в условиях неопределенности 31
типы полностью объясняю тся эффектом «привязки». У становленная веро­
ятность элементарного события (успех в любой стадии) обеспечивает есте­
ственную отправную точку для оценки вероятностей к ак конъю нктивны х,
таки дизъю нктивных событий. Так как «корректировки» от отправной точ­
ки обычно недостаточно, заклю чительные оценки остаю тся слиш ком при­
ближенными к вероятностям элементарны х событий в обоих случаях. Об­
ратите внимание, что полная вероятность конъю нктивны х событий ниж е,
чем вероятность каждого элементарного события, в то время к ак полная
вероятность несвязанного события выш е, чем вероятность каж дого элемен­
тарного события. Следствием «привязки» является то, что полная вероят­
ность будет завыш ена для конъю нктивны х событий и заниж ена - для дизъ­
ю нктивных.
Предубеждения в оценке слож ны х событий особенно существенны в кон­
тексте планирования. Успешное заверш ение бизнес-предприятия, напри­
мер, разработка нового продукта, обычно носит комплексны й характер:
чтобы предприятие преуспевало, каж дое событие из ряда должно произой­
ти. Даж е, если каждое из этих событий весьма вероятно, полная вероятность
успеха может быть довольно низкой, если количество событий большое.
Общая тенденция оценивать слиш ком высоко вероятность конъю нктивных
событий ведет к необоснованному оптимизму в оценке вероятности, что план
будет удачным, или что проект будет закончен вовремя. Наоборот, с дизъ­
юнктивными структурами событий обычно сталкиваю тся при оценке рис­
ка. Сложная система, такая к ак ядерный реактор или тело человека, повре­
дится, если любой из его необходимых компонентов выйдет из строя. Д аж е,
когда вероятность сбоя в каж дом компоненте небольш ая, вероятность отка­
за всей системы может быть вы сока, если в нее вовлечено много компонен­
тов. И з-за предубеждения «привязки», люди имеют тенденцию недооцени­
вать вероятность отказа в слож ны х системах. Таким образом, предубежде­
ние привязки мож ет иногда зависеть от структуры события. Структура со­
бытия или явления похож ая на цепочку звеньев ведет к переоценке вероят­
ности этого события, структура события похож ая на воронку, состоящ ая из
дизъю нктивных звеньев, ведет к недооценке вероятности события.

«Привязка» при оценке распределения субъективной вероятности


При анализе принятия реш ений, от экспертов часто требуется вы разить свое
мнение относительно какой-либо величины , например, среднего значения
индекса Доу-Джонса (Dow-Jones) в отдельно взяты й день, в виде распреде­
ления вероятности. Такое распределение обычно строится путем выбора
значений для величины , которые соответствуют его процентной ш кале рас­
пределения вероятности. Н апример, эксперта можно попросить выбрать
число, Х90 так, чтобы субъективная вероятность того, что это число будет
выше, чем значение среднего числа Доу-Джонса, бы ла 0.90. То есть, он дол­
жен выбрать значение Х90, так чтобы в 9 случаях к 1 среднее значение ин­
32 ВВЕДЕНИЕ
декса Доу-Джонса не превыш ало это число. Распределение субъективной
вероятности значения среднего числа Доу-Джонса может быть построено
из нескольких таких оценок, вы раж енны х с помощью различны х процент­
ны х ш кал.
П утем накопления таких субъективны х распределений вероятности для
различны х величин, можно проверить правильность оценок эксперта. Экс­
перт считается калиброванным (см. гл. 22) должным образом в определен­
ном наборе проблем, если только 2 процента правильны х значений оценен­
ны х величин будут ниж е заданных значений Х2. Например, правильные зна­
чения долж ны быть ниж е Х01 для 1% величин и быть выш е Х 99, для 1%
величин. Таким образом, истинные значения должны строго попадать в ин­
тервал между Х 01 и Х 99в 98% задач.
Н есколько исследователей (A lpert и R aiffa, 1969, 21; Stael von H olstein,
1971b; W inkler, 1967) проанализировали наруш ения в оценке вероятности
для многих количественны х величин для большого числа экспертов. Эти
распределения указали на обширные и систематические отклонения от над­
леж ащ их оценок. В большинстве исследований, фактические значения оце­
ненны х величин или меньш е Х 01 или больше, чем Х 99 приблизительно для
30% задач. То есть, испытуемые устанавливаю т слиш ком узкие строгие
интервалы , которые отражаю т их уверенность, чем их знания относитель­
но оцененных величин. Это предубеждение характерно к ак для подготов­
ленны х, так и для простых тестируемых, и этот эффект не устраняется пу­
тем введения правил оценки, которые обеспечивают стимулы для внеш ней
оценки. Этот эффект, по крайней мерю, частично, относится к «привязке».
Чтобы выбрать Х90как значение среднего числа Доу-Джонса, например,
естественно начать с размы ш ления о лучш ей оценке индекса Доу-Джонса и
«скорректировать» верхние значения. Если эта «корректировка» - как и боль­
шинство других - является недостаточной, то Х ^ не будет достаточно экстре­
мальным. Подобный эффект фиксирования произойдет в выборе Х 10, кото­
ры й предположительно получен путем корректировки чьей-либо лучш ей
оценки в сторону понижения. Следовательно, достоверный интервал между
Х 10 и Х90 будет слиш ком узкий, и оцененное распределение вероятности бу­
дет слиш ком ж естким. В подтверждение этой интерпретации можно пока­
зать, что субъективные вероятности систематически меняются посредством
процедуры, в которой чья-либо лучш ая оценка не служит «привязкой».
Распределения субъективной вероятности для данной величины (сред­
нее число Доу-Джонса) могут быть получены двумя различны ми способа­
ми: (i), попросить испытуемого выбрать значение числа Доу-Джонса, кото­
рое соответствует распределению вероятности выраж енной с помощью про­
центной ш калы и (ii), попросить испытуемого оценить вероятности того, что
истинное значение числа Доу-Джонса превысит некоторые указанны е ве­
личины . Эти две процедуры формально эквивалентны и должны приводить
в результате к идентичным распределениям. Однако они предлагаю т раз­
личны е способы корректировки от различны х «привязок». В процедуре (i),
Принятие решений в условиях неопределенности 33
естественная отправная точка - лучш ая оценка качества. В процедуре (ii),
с другой стороны, тестируемый может «привязаться» к величине, установ­
ленной в вопросе. В противоположность этому, он может «привязаться» к
равным шансам, или к шансам 50 на 50, которые являю тся естественной
отправной точкой при оценке вероятности. В любом случае, процедура (ii)
должна завершаться менее крайними оценками, чем процедура (i).
Чтобы противопоставлять эти две процедуры, группе тестируемых был
предоставлен набор 24 количественных измерений (как, например, рассто­
яние по воздуху от Нью-Дели до Пекина), которые оценивали или Х10 или
Х90 для каждой задачи. Другая группа тестируемых получила средние оцен­
ки первой группы для каждой из этих 24 величин. Их попросили оценить
шансы того, что каж дая из данных величин превысила истинное значение
соответствующей величины. В отсутствии какого-либо предубеждения вто­
рая группа должна восстановить вероятность, указанную первой группой,
то есть 9:1. Однако если равные шансы или заданная величина служат «при­
вязкой» , вероятность, указанная второй группой должна быть менее экст­
ремальной, то есть ближе к 1:1. В действительности, средняя вероятность,
указанная этой группой, во всех задачах, была 3:1. Когда суждения из этих
двух групп были проверены, обнаружилось, что испытуемые в первой груп­
пе были слиш ком экстремальны в оценках в соответствии с более ранними
исследованиями. События, вероятность которых, они определили к ак 0.10,
фактически произошли в 24% случаев. Напротив, тестируемые во второй
группе были слишком консервативны. События, вероятность которых, они
определили к ак 0.34, фактически произошли в 26% случаев. Эти результа­
ты иллюстрируют то, как степень правильности оценки зависит от проце­
дуры оценки.

О бсуж ден и е
В этой части книги рассматривались когнитивные стереотипы, которые воз­
никают к ак результат уверенности в эвристиках оценивания. Эти стереоти­
пы не характерны для эффектов мотивации, таких к ак принятие желаемо­
го за действительное или искаж ения суждений из-за одобрения и порица­
ния. Действительно, как уже сообщалось ранее, некоторые серьезные ошиб­
ки в оценивании происходили, несмотря на тот факт, что тестируемых по­
ощ ряли за точность и вознаграждали за правильные ответы (Kahneman и
Tversky, 1972b, 3; Tversky и K ahneman, 1973,11).
Уверенность в эвристиках и распространенность стереотипов свойствен­
на не только обывателям. Опытные исследователи такж е склонны к тем ж е
самым предубеждениям - когда они думают интуитивно. Например, тен­
денция предсказывать результат, который наиболее репрезентативен по от­
ношению к данным, без достаточного внимания к априорной вероятности
наступления такого результата, наблюдались в интуитивных суждениях
людей, которые обладали обширными познаниями в статистике (Kahneman
34 ВВЕДЕНИЕ
и Tversky, 1973,4; Tversky и Kahneman, 1971,2). Хотя те, кто имеют позна­
ния в статистике и избегают элементарных ошибок, как, например, ошиб­
ки игрока в казино, в интуитивных суждениях для более запутанных и ме­
нее понятных задач делают подобные ошибки.
Не удивительно, что полезные разновидности эвристики, такие как реп­
резентативность и доступность сохраняются, даже при том, что они иногда
ведут к ошибкам в прогнозах или оценках. Что возможно и является удиви­
тельным, так это неспособность людей вывести из длительного жизненного
опыта такие фундаментальные статистические правила к а к регресс к сред­
нему или эффект размера выборки при анализе изменчивости внутри вы ­
борки. Х отя все мы в течение ж изни встречаемся с многочисленными ситу­
ациям и, к которым эти правила могут быть применимы, очень немногие
самостоятельно открывают принципы отбора выборки и регресса на своем
опыте. Статистические принципы не познаются на основе каждодневного
опыта, потому что соответствующие примеры не закодированы нужным
образом. Например, люди не обнаруживают, что средняя длина слова в стро­
ках следующих друг за другом в тексте, отличается больше чем на следую­
щ их друг за другом страницах, потому что они просто не обращают внима­
ния на среднюю длину слова в отдельных строках или страницах. Таким
образом, люди не изучают отношение между размером выборки и изменчи­
востью внутри выборки, хотя данных для такого вывода предостаточно.
Недостаток соответствующей кодировки такж е объясняет, почему люди
обычно не обнаруживают стереотипы в своих суж дениях о вероятности.
Человек мог бы узнать, правильны ли его оценки, подсчитывая число собы­
тий, которые действительно происходят из тех, которые он считает равно­
вероятными. Однако для людей не естественно группировать события по
признаку их вероятности. При отсутствии такой группировки человек не
может обнаружить, например, что только 50% предсказаний, вероятность
которых он оценил к ак 0.9 или выше фактически сбылись.
Эмпирический анализ когнитивных стереотипов имеет значение для тео­
ретической и прикладной роли оценки вероятностей. Современная теория
принятия решений (de F inetti, 1968; Savage, 1954) рассматривает субъек­
тивную вероятность к ак количественное мнение идеализированного чело­
века. Определенно, субъективная вероятность данного события определя­
ется набором шансов относительно этого события, из которых человеку пред­
лагается выбрать. Может быть получено внутренне последовательное или
целостное измерение субъективной вероятности, если выборы человека сре­
ди предложенных шансов подчиняются некоторым принципам, то есть а к ­
сиомам теории. Полученная вероятность субъективна в том смысле, что
различные люди могут иметь различные оценки вероятности одного и того
ж е события. Главный вклад этого подхода состоит в том, что он обеспечива­
ет строгую субъективную интерпретацию вероятности, которая является
применимой к уникальным событиям и является частью общей теории ра­
ционального принятия решений.
Принятие решений в условиях неопределенности 35
Возможно, стоит отметить, что, в то время к ак субъективные вероятнос­
ти могут иногда выводиться из выбора шансов, они обычно не формируют­
ся этим способом. Человек делает ставку скорее на команду А, чем на ко­
манду В, потому что верит, что команда А, вероятнее всего, победит; он не
выводит свое мнение к ак результат предпочтений тех или иных шансов.
Таким образом, в действительности, субъективные вероятности определя­
ют предпочтения в шансах, но не выводятся из них, в отличие от аксиома­
тической теории рационального принятия решений (Savage, 1954).
Субъективный характер вероятности привел многих ученых к мнению,
что целостность, или внутренняя последовательность - единственный име­
ющий силу критерий, в соответствии с которым должны быть оценены ве­
роятности. С точки зрения формальной теории субъективной вероятности,
любой набор внутренне последовательных вероятностных оценок столь ж е
хорош к а к любой другой. Этот критерий не вполне удовлетворителен, пото­
му что внутренне последовательный набор субъективных вероятностей мо­
ж ет быть несовместим с другими мнениями, которых придерживается че­
ловек. Рассмотрите человека, чьи субъективные вероятности для всех воз­
можных результатов подбрасывания монеты отражают ошибку игрока в
казино. То есть его оценка вероятности появления «решки» при каждом
конкретном подбрасывании увеличивается с числом последовательно вы ­
павш их «орлов», которые предшествовали этому подбрасыванию. Сужде­
ния такого человека могут быть внутренне последовательными и поэтому
приемлемыми к а к адекватные субъективные вероятности согласно крите­
рию формальной теории. Эти вероятности, однако, являю тся несовмести­
мыми с общепринятым мнением, что у монеты “нет пам яти” и поэтому она
не способна производить последовательные зависимости. Чтобы оцененные
вероятности, считались адекватными, или рациональными, внутренней
последовательности недостаточно. Суждения должны быть совместимы со
всеми прочими взглядами этого человека. К сожалению, не может быть про­
стой формальной процедуры для оценки совместимости набора вероятност­
ных оценок с полной системой взглядов субъекта. Рациональный эксперт
будет, однако, бороться за совместимость, даже при том, что внутреннюю
последовательность более легко достичь и оценить. В частности он будет
пытаться делать свои вероятностные суждения совместимыми с его знани­
ями относительно предмета, законов вероятности и своей собственной эври­
стики оценки и предубеждений.

Резюме
Эта статья описывает три типа эвристики, которые используются при оцен­
ках в условиях неопределенности: (i) репрезентативность, которая обычно
используется, когда людей просят оценить вероятность того, что объект А
или случай принадлежит классу или процессу В; (ii) доступность событий
или сценариев, которая часто используется, когда людей просят оценить
частоту класса или правдоподобия отдельно взятого варианта развития со­
бытий; и (Ш) корректировка или «привязка», которая обычно использует­
ся при количественном прогнозировании, когда доступна соответствующая
величина. Эти эвристики высоко экономичны и обычно эффективны, но они
приводят к систематическим ошибкам в прогнозе. Лучшее понимание этих
эвристик и отклонений, к которым они приводят, могло внести вклад в оцен­
ку и принятие решений в условиях неопределенности.
Часть II
Репрезентативность
2. Вера в закон малых чисел*

Амос Тверски и Даниелъ Канеман

“Предположим, что Вы провели эксперимент с 20 испытуемыми, и получи­


ли значим ы й результат, которы й подтверж дает Вашу теорию (z = 2.23,
р < 0.05, «двустороннее»). Вы теперь имеете основание для проведения экс­
перимента с дополнительной группой из 10 испытуемых. К ак Вы думаете,
какова вероятность того, что результаты будут значимыми, если будет про­
водиться испытание с односторонним критерием, причем отдельно для этой
группы? “
Если Вы считаете, что вероятность где-то около 0.85, Вы можете быть
удовлетворены тем, что принадлежите к большинству. Действительно, это
был среднестатистический ответ двух малых групп, которые любезно со­
гласились ответить на анкету, распространенную на встрече Группы мате­
матической психологии в Американской Психологической Ассоциации.
С другой стороны, если Вы считаете, что вероятность около 0.48, Вы при­
надлежите к меньшинству. Только 9 из наш их 84 респондентов дали ответы
между 0.40 и 0.60. Однако оказывается, что 0.48 — намного более обоснован­
ная оценка, чем 0.851.

1 Требуемую оценку можно интерпретировать несколькими способами. Один возможный


подход состоит в том, чтобы следовать общей практике исследования, где оценка, получен­
ная в одном исследовании, принимается для того, чтобы определить правдоподобную аль­
тернативу отсутствующей гипотезе. Требуемую вероятность можно тогда интерпретиро­
вать как достоверность второго теста (то есть, вероятность получения значимого результата
во второй выборке) в противоположность альтернативной гипотезе, определенной резуль­
татом первой выборки. В особом случае теста среднего значения с известной изменчивос­
тью, можно было бы вычислить достоверность теста по отношению к гипотезе, что среднее
для всей совокупности равняется среднему для выборки. Так как размер второй выборки
- половина первой выборки, подсчитанная вероятность получения z > 1.645- только 0.473.
Теоретически более достоверный подход состоит в том, чтобы интерпретировать требуемую
вероятность в пределах структуры Байеса, вычислить ее относительно соответственно выб­
ранного предшествующего распределения. Допуская предыдущую равномерность распре­
деления, требуемая вероятность в последующем - 0.478. Ясно, что, если предшествующее
40 РЕПРЕЗЕНТАТИВНОСТЬ
Очевидно, большинство психологов преувеличенно верят в вероятность
успешного повтора полученных результатов. Вопросы, которых касается
эта часть книги - это источники такой уверенности, и их последствия для
проведения научного исследования. Наш тезис состоит в том, что люди об­
ладают сильными предубеждениями относительно случайной выборки; что
эти предубеждения ошибочны фундаментально; что эти предубеждения
характерны к ак для простых испытуемых, так и для подготовленных уче­
ных; и что ее применение в ходе научного исследования имеет неудачные
последствия.
Мы представляем на обсуждение тезис о том, что люди рассматривают
выборку отобранную случайным образом из совокупности к ак высоко реп­
резентативную, то есть подобную всей совокупности во всех существенных
характеристиках. Следовательно, они ожидают, что любые две выборки, взя­
тые из ограниченной совокупности, будут более подобны друг другу и сово­
купности, чем предполагает теория выборок, по крайней мере, для малых
выборок.
Тенденция расценивать выборку к ак репрезентативную наблюдается в
самых разнообразных ситуациях. Когда тестируемых просят создать слу­
чайную последовательность гипотетических подбрасываний монеты, напри­
мер, они создают последовательности, где пропорция «орла» на любом ко­
ротком отрезке гораздо ближе к 0.50, чем предсказала бы теория вероятно­
сти (Tune, 1964). Таким образом, каж ды й отрезок полученной последова­
тельности высоко репрезентативен по отношению к «справедливости» мо­
неты. Подобные эффекты наблюдаются, когда тестируемые последователь­
но предсказывают события в созданном случайным образом ряде событий,
к ак в экспериментах по изучению вероятности (Estes, 1964) или в других
последовательных играх с шансами. Тестируемые действуют так, к ак буд­
то, каждый отрезок случайной последовательности должен отражать пра­
вильную пропорцию: если последовательность отклонилась от пропорции
во всей совокупности, ожидается корректирующее отклонение в другом
направлении. Это получило название ошибки игрока казино.
Суть ошибки игрока казино - неправильное представление о справедли­
вости закона случайности. Игрок чувствует, что равнозначность сторон мо­
неты дает ему право ожидать, что любое отклонение в одном направлении
будет скоро компенсировано соответствующим отклонением в другую сто­
рону. Д аж е самая сбалансированная монета, однако, обладая ограничения­
ми морали и памяти, не может при подбрасывании выдавать столь же рав­
новероятные результаты, как того ожидает игрок в казино. Эта ошибка свой­
ственна не только игрокам. Рассмотрим следующий пример:

распределение подтверждает нулевую гипотезу, как это часто бывает, следующая вероят­
ность будет даже меньшей.
Данная глава первоначально появилась в Психологическом Бюллетене, 1971, 2,105 -110.
Авторское право © 1971 Американской Психологической Ассоциацией. Переиздано в соот­
ветствии с разрешением.
Вера в закон малых чисел 41
Средний IQ среди восьмиклассников в городе, как известно, является 100. Вы выбрали
случайную выборку из 50 детей для изучения достижений в учебе. Первый протестиро­
ванный ребенок имеет IQ 150. Каким, как Вы ожидаете, будет средний показатель ин­
теллекта для всей выборки?

Правильный ответ - 1 0 1 . Неожиданно большое количество людей полага­


ют, что ожидаемый IQ для выборки все равно 100. Это может быть оправда­
но только мнением, что случайный процесс самокорректируется. Высказы­
вания типа “ошибки компенсируют друг друга” отражают представление
людей об активном процессе самокоррекции случайных процессов.
Некоторые распространенные процессы в природе подчиняются таким
законам: отклонение от устойчивого равновесия порождает силу, которая
восстанавливает равновесие. Законы вероятности, напротив, не работают
подобным образом: отклонения не отменяются по мере перебора элементов
выборки, они ослабляются.
До сих пор, мы пытались описать два взаимосвязанных вида предубеж­
дений для определения шансов. Мы предложили гипотезу репрезентатив­
ности, согласно которой люди полагают, что выборки будут очень подобны­
ми друг другу и совокупностям, из которых они отобраны. Мы такж е пред­
положили, что люди считают, что процессы в выборке — это самокорректи­
рующийся процесс. Эти два мнения ведут к одним и тем ж е последствиям.
Оба порождают ожидания относительно выборки, и изменчивость этих про­
гнозов меньше, чем реальная изменчивость, по крайней мере, для малых
выборок.
Закон больших чисел гарантирует, что очень большие выборки будут дей­
ствительно высоко репрезентативны по отношению к совокупности, из ко­
торой они взяты . Если, кроме того, действует тенденция саморегуляции, то
маленькие выборки должны такж е быть высоко репрезентативными и по­
добными друг другу. И нтуиция людей относительно случайных выборок,
каж ется, соответствует закону малы х чисел, который утверждает, что за­
кон больших чисел применяется такж е и к малым числам.
Рассмотрим гипотетического ученого, который ж ивет в соответствии с
законом малых чисел. К ак его убеждения влияли бы на его научную рабо­
ту? Предположим, что наш ученый изучает явления, величина которых
маленькая относительно ее неконтролируемой изменчивости, то есть, соот­
ношение сигнала и помехи в сообщениях, которые он получает от природы
изучаемого явления, невелико. Наш ученый мог быть метеорологом, фар­
макологом, или возможно психологом.
Если ученый верит в закон малых чисел, то он будет переоценивать вы ­
воды, сделанные на маленьких выборках. Чтобы проиллюстрировать это,
предположим, что он занят изучением того, какую из двух игруш ек пред­
почли бы маленькие дети. Из первых пяти малышей, которых он изучил,
четыре отдали предпочтение одной и той ж е игрушке. Немало психологов
на этом этапе будут ощущать некоторую уверенность в том, что нулевая ги­
потеза о том, что никакой из игруш ек не отдается предпочтение, ложна. К
42 РЕПРЕЗЕНТАТИВНОСТЬ
счастью, такая убежденность не является достаточным условием для пуб­
ликации статьи в журнале, хотя оно может подойти для книги. С помощью
быстрых подсчетов, наш психолог обнаружит, что вероятность результата,
который был бы столь ж е предельным, как полученный им, столь ж е высо­
к а к а к 3 /8 при нулевой гипотезе.
Безусловно, применение статистической проверки гипотезы для научного
вывода связано с серьезными трудностями. Тем не менее, вычисление уров­
ней значимости (или коэффициентов вероятности, к ак предпочел бы Байес)
заставляет ученого оценивать полученный эффект скорее в терминах оцен­
ки надежности изменчивости выборки, чем в терминах своей субъективной
оценки, в которой присутствуют отклонения. Статистические испытания,
исходя из этого, защ ищ ают научное сообщество от чрезмерно поспешного
отказа от нулевой гипотезы (ошибка первого рода) контролируя многих сво­
их членов, которые предпочли бы ж ить в соответствии с законом малых
чисел. С другой стороны, не имеется никаких эффективных гарантий про­
тив того, что не удастся утвердить вполне обоснованную исследовательскую
гипотезу (ошибка второго рода).
Вообразите психолога, который изучает взаимосвязь между потребностью
в достижениях и ученой степенью. Реш ая, какой размер будет у его выборки,
он может рассуждать следующим образом: “Какую взаимосвязь я ожидаю?
г = 0.35. Какой N мне нужен для того, чтоб мой результат был значимым?
(Смотрит в таблицу.) N = 33. Прекрасно, это — моя выборка”.
Единственный недостаток в этом рассуждении — то, что наш психолог
забыл о разнообразии среди элементов выборки, возможно, потому что он
полагает, что любая выборка должна быть высоко репрезентативна по отно­
шению к совокупности, из которой она взята. Однако, если его предположе­
ние относительно корреляции в совокупности верно, корреляция в выборке
может быть около 0.35. Следовательно, вероятность получения значимого
результата (то есть, надежность теста) для N —33 приблизительно равна 0.50.
В детальн ом исследован ии м ощ ности стати сти ческ и х к р и тер и ев ,
Д ж . KoeH(J. Cohen, 1962,1969) привел правдоподобные определения боль­
ш и х, средних, м алы х результатов, обширного набора вычислительны х
средств для оценки мощности разнообразных статистических тестов. В нор­
мальном тесте значение разности между двумя средними, например, раз­
ность 0.2 5а считается маленькой, разность 0.50 а — средней, и разность в 1а
является большой, согласно предложенным определениям. Средняя раз­
ность между уровнем интеллекта служ ащ их и уровнем интеллекта рабочих
со средней квалификацией - это средний результат. В исследовании науч­
ной практики, Д ж . Коен (1962) рассмотрел все статистические исследова­
н ия, изданные в одном томе ж урнала «Психопаталогия и социальная пси­
хология» , и вычислил вероятность обнаружения каждого из трех значений
результата. Средняя мощность для обнаружения маленьких результатов
была 0.18, 0.48 - для средних результатов, и 0.83 - для больших результа­
тов. Если психологи к а к обычно ожидают появление средних результатов и
Вера в закон малых чисел 43
выбирают размер выборки по такому ж е принципу, как и в вышеупомяну­
том примере, надежность их исследований должна действительно быть при­
близительно 0.50.
Анализ Дж. Коена показывает, что статистическая мощность многих пси­
хологических исследований очень мала. Это - пагубная практика: она разо­
чаровывает ученых и понижает эффективность исследования. Исследовате­
лю, который проверяет действенную гипотезу, но не может получить значи­
мых результатов, ничего не остается, кроме к ак рассматривать природу не­
надежной или даже враждебной. Кроме того, к ак показал Оверолл (Overall,
1969), распространенность исследований, несовершенных в статистической
мощности не только иррациональна, но и фактически вредна: результатом ее
является большое количество необоснованных отказов от использования ну­
левой гипотезы среди опубликованных результатов.
Поскольку изучение статистической мощности имеет особую важность в
смысле организации повторных исследований, мы исследовали отношение
к повторяемости в нашем анкетном опросе.
Предположим, что один из Ваших докторантов закончил трудный и продолжитель­
ный по времени эксперимент, включающий в качестве испытуемых 40 животных. Он
зафиксировал и проанализировал большое количество переменных. Пока результаты
неокончательные, но одно предварительное сравнение оказалось высоко значи­
мым t = 2.70, что было очень неожиданным и могло представлять большое теоретичес­
кое значение.
Учитывая важность результата и его неожиданное значение, и количество анализов,
которые проделал докторант, порекомендовали бы Вы ему воспроизвести исследова­
ние перед публикацией работы? Если Вы рекомендуете ему повторить исследование, то
с каким количеством животных Вы посоветуете ему поработать?

Среди опрошенных психологов, преобладало мнение относительно повтор­


ного исследования: его порекомендовало 66 из 75 респондентов, вероятно,
потому что они подозревали, что единственно значимый результат был слу­
чайным. Среднестатистическая рекомендация докторанту была обработать
20 испытуемых в повторном исследовании. Поучительно рассмотреть веро­
ятные последствия этого совета. Если среднее значение и дисперсия элемен­
тов во второй выборке фактически идентичны тем ж е показателям первой
выборки, то результирующее значение t будет 1.88. Следуя рассуждениям
в Примечании 1 шанс докторанта получить значимый результат при повто­
рении - только немного выше половины (для р = 0.05, одностороннего тес­
та). Так к а к мы ожидали, что повторная выборка из 20 испытуемых, будет
казаться обоснованной для наш их респондентов, мы добавляли следующий
вопрос:
Предположите, что Ваш несчастный докторант фактически повторил начальное иссле­
дование, увеличив размер выборки животных на 20, и не получил значительного резуль­
тата в этом направлении, t = 1.24. Что бы Вы порекомендовали ему теперь? Числа в круг­
лых скобках указывают число респондентов, которые отметили этот ответ
( А) Он должен объединить результаты и издавать свои выводы как факт. (0)
44 РЕПРЕЗЕНТАТИВНОСТЬ
( B) Он должен сообщить о результатах как о предварительном открытии. (26)
( C) Он должен поработать с другой группой животных (состоящей в среднем из 20).
( 21 )
(D) Он должен пробовать найти объяснение различиям между этими двумя группа­
ми. (30)

Обратите внимание, что независимо от уверенности в первоначальном от­


кры тии, его правдоподобность, конечно, возросла после повторного прове­
дения опыта. Не только был получен похожий экспериментальный резуль­
тат в двух выборках, но такж е и значимость результата в повторном опыте
составила полных две трети величины результата в первоначальном иссле­
довании. Ввиду размера выборки (20), который порекомендовали наши рес­
понденты, повторное проведение эксперимента было приблизительно на­
столько успешным, насколько можно ожидать. Распределение ответов, од­
нако, отражает существующий и поныне скептицизм относительно откры ­
тия докторанта, за которым последовал повторный эксперимент, к ак и ре­
комендовалось. Это плачевное состояние дел - типично последствие недо­
статочной статистической надежности.
В отличие от ответов В и С, которые могут иметь некоторые основания,
наиболее популярный ответ, ответ D, является неприемлемым. Мы сомне­
ваемся, что этот ж е ответ был бы получен, если бы респонденты понимали,
что разница между двумя исследованиями даж е приблизительно не явл я­
ется значимой. (Если дисперсия элементов этих двух выборок равны , то
t = 0.53.) В отсутствии статистической проверки, наши респонденты следо­
вали гипотезе репрезентативности: поскольку различие между этими дву­
м я выборками была больше, чем, они ожидали, они рассмотрели это к ак
основание для объяснений. Однако попытка «найти объяснение различию
между этими двумя группами», является, по всей вероятности, попыткой
объяснить появление помехи.
Н аш и респонденты, все вместе, оценили проведение повторного исследо­
вания довольно грубо. Это следует из гипотезы репрезентативности: если
мы ожидаем, что все выборки очень похожи друг на друга, то почти все по­
вторения правомерной гипотезы должны быть статистически значимы. Гру­
бость критерия для успешного повторения опыта может быть продемонст­
рирована в ответе на следующий вопрос:
Исследователь сообщил результат, который Вы считаете неправдоподобным. Он про­
вел исследование с 15 испытуемыми, и получил значимую величину, t = 2.46. Другой
исследователь попытался повторить его опыт, но он получил не значимую величину t
для того же числа субъектов. Инструкция была та же самая в обоих экспериментах.
Вы просматриваете литературу. Какова наибольшая величина t во втором эксперимен­
те, про которую Вы могли бы сказать, что ее невозможно воспроизвести?

Большинство наш их респондентов оценило t = 1.70 как неудачу в повторе­


нии исследования. Если суммировать данные двух таких исследований
(t = 2.46 и t = 1.70), значение t для объединенных данных приблизительно
Вера в закон малых чисел 45
3.00 (при равных дисперсиях). Таким образом, перед нами парадоксальное
положение дел, при котором одни и те ж е данные, которые увеличили бы
нашу уверенность по поводу результата, при рассмотрении к ак часть перво­
начального исследования, пошатнули бы наш у уверенность, если бы рас­
сматривались как независимое исследование. Этот двойной стандарт осо­
бенно беспокоит с тех пор, к а к , по многим причинам, повторные проведе­
ния опытов обычно рассматриваются к ак независимые исследования, и ги­
потезы часто оцениваются с помощью перечня непоследовательных данных,
подтверждающих их.
Вопреки широко распространенному мнению, может быть так, что вы ­
борка повторного опыта часто больше, чем изначальная. Решение воспро­
извести когда-то полученный результат часто является следствием того, что
исследователь очень доволен результатом и хочет, чтобы скептически на­
строенное научное сообщество его приняло. Так к а к сообщество необосно­
ванно требует, чтобы результаты повторного эксперимента были значимы
независимо от изначального эксперимента, или, по крайней мере, чтобы они
были хотя бы приблизительно значимыми, существует необходимость об­
рабатывать большую выборку. В качестве иллюстрации приведем пример,
что если неудачливый докторант, чья диссертация обсуждалась, приним а­
ет валидность своего первоначального результата (t = 2.70, N = 40), и если
он хочет, чтобы риск того, что он получит t меньше 1.70, была только 0 Л , он
должен будет провести работу приблизительно с 50 животными в своем по­
вторном исследовании. С несколько более слабым первоначальным резуль­
татом (t = 2.20, N = 40), размер повторной выборки, требуемый для получе­
ния такой ж е мощности теста, возрастает приблизительно до 75.
То, что результаты, обсужденные к настоящему времени, не ограничены
только гипотезами относительно средней величины и дисперсии показыва­
ют ответы на следующий вопрос:
Вы выполнили исследование корреляции, оценивая 20 переменных для 100 испытуе­
мых. Двадцать семь из 190 коэффициентов корреляции являются значимыми на уров­
не 0.05; и 9 из них значимы за пределами 0.01. Среднее абсолютного уровня значимых
корреляций - 0.31, и образец результатов теоретически обоснован. Как вы считаете,
сколько из 27 значимых корреляций, по Вашим ожиданиям, снова будут значимыми,
при точном повторении исследования, при N = 40?

При N = 40, требуется корреляция приблизительно 0.31 уровня для того,


чтобы она была существенной на уровне 0.05. Это средняя величина значи­
мых корреляций в первоначальном исследовании. Таким образом, только
около половины первоначально значимых корреляций (то есть, 13 или 14)
остались бы значимыми при N =40. Кроме того, конечно, корреляции в повтор­
ном исследовании должны отличаться от корреляций в оригинальном ис­
следовании. Следовательно, благодаря регрессии, первоначально значимые
коэффициенты, наиболее вероятно, уменьшатся. Таким образом, от 8 до 10
повторяемых корреляций из первоначальных 27 - это максимум из того,
46 РЕПРЕЗЕНТАТИВНОСТЬ
что можно ожидать. Средняя оценка наш их респондентов - 18. Это больше
чем количество значимых корреляций повторного опыта, которые будут
получены, если корреляции повторно вычислены для 40 испытуемых, выб­
ранны х наугад из первоначальных 100! Очевидно, люди ожидают больше­
го, чем простое дублирование первоначальной статистики в выборке повтор­
ного исследования; они ожидают, повторения значимых результатов, не
принимая в расчет размер выборки. Это ожидание требует нелепого продол­
ж ения гипотезы репрезентативности; даже закон малых чисел не способен
произвести подобных результатов.
Надежда на то, что результаты возможно воспроизвести почти во всей
полноте, объясняет обычное, хотя и довольно прискорбное явление. Иссле­
дователь, который вычисляет все корреляции между тремя индексами тре­
вожности и тремя индексами зависимости, будет часто сообщать и доволь­
но уверенно интерпретировать единственную полученную существенную
корреляцию. Его уверенность в неточном результате является следствием
его убеждения, что полученная матрица корреляций высоко репрезентатив­
на и легко воспроизводима.
В этом разделе, мы увидели, что сторонник закона малых чисел ведет свою
научную деятельность следующим образом:
1. Он подвергает риску свои исследовательские гипотезы на небольших
выборках, не осознавая, что шансы в его пользу чрезвычайно низки. Он пе­
реоценивает мощность.
2. Он необоснованно уверен в ранних тенденциях (например, в данных,
полученных на первых нескольких испытуемых) и в стабильности наблю­
дений (например, в количестве и идентичности значимых результатов). Он
переоценивает значимость.
3. В оценке повторных исследований, своих собственных или чуж их, он
имеет необоснованно высокие ожидания относительно воспроизводимости
значимых результатов. Он недооценивает величину доверительных интер­
валов.
4. Он редко объясняет отклонение от ожидаемых результатов выборки
изменчивостью выборок, потому что он находит “объяснение” любому не­
соответствию. Таким образом, он имеет мало возможностей распознать и з­
менчивость выборок в действии. Поэтому его вера в закон малых чисел, на­
всегда останется непоколебимой.
Наш анкетный опрос вы являл многочисленные примеры распространен­
ности веры в закон малы х чисел2. Нашим типичным респондентом являлся
сторонник этого закона, независимо от группы, к которой он принадлежит.

2В. Эдвардз (1968,25) обосновал, что люди терпят неудачу в извлечении достаточного коли­
чества информации или определенности из вероятностных данных. Он назвал эту неудачу
консерватизмом. Наши респонденты вполне подходят под описание консерваторов. Ско­
рее, в соответствии с гипотезой репрезентативности, они имеют тенденцию извлекать из
данных большее количество определенности, чем данные, фактически, содержат.
Вера в закон малых чисел 47
Не было фактически никаких различий между среднестатистическими от­
ветами в аудитории на собрании, где обсуждались проблемы математичес­
кой психологии и на общей сессии съезда Американской Психологической
Ассоциации, хотя мы не заявляем о репрезентативности любой из этих двух
выборок. Очевидно, познания в области формальной логики и теории веро­
ятности не уменьшают ошибочную интуицию. Что же, в таком случае, мож ­
но сделать? Можно ли искоренить веру в закон малых чисел или, по край­
ней мере, контролировать ее?
Опыт исследований, вряд ли, сильно поможет, потому что дисперсия
выборок такж е легко «объясняется». Корректирующие эксперименты - это
эксперименты, которые не обеспечивают ни мотива, ни возможности для
ложного объяснения. Таким образом, студент, изучающий статистику, мо­
жет брать повторяемые выборки заданного размера из совокупности, и изу­
чать влияние размера выборки на изменчивость выборки на личном опыте.
Однако нет уверенности, что ож идания могут быть скорректированы таким
способом, так как предубеждения, подобные таким, к а к ошибки игрока в
казино, сохраняются несмотря на опыт.
Даже если нельзя отказаться от стереотипов, студенты могут научиться
распознавать их существование и принимать необходимые меры предосто­
рожности. Так к ак в обучении статистике немало предостережений, пре­
дупреждение относительно стереотипности статистической интуиции не
может быть неуместным. Очевидная ъ-ера предосторожности это вычисле­
ние. Сторонник закона малых чисел имеет ошибочные убеждения относи­
тельно уровня достоверности, мощности и интервалов доверительности.
Уровни значимости обычно вычисляются, и о них сообщается, а мощность
и интервалы доверительности - нет. Возможно, они должны быть.
Явное вычисление мощности, относящееся к некоторой обоснованной
гипотезе, например, малым, большим и средним результатам Дж.Коена (1962,
1969), несомненно, должно быть выполнено до того, к а к проведено исследо­
вание. Такие вычисления ведут к осознанию того, что нет никакого смысла
проводить исследование, если, например, размер выборки не увеличить в 4
раза. Мы отказываемся от убеждения, что серьезный исследователь созна­
тельно пойдет на риск 0.50 того, что его обоснованная гипотеза исследова­
ния так и не будет подтверждена. Кроме того, вычисление надежности су­
щественны для интерпретации отрицательных результатов, то есть, если
не удалось отказаться от нулевой гипотезы. Поскольку интуитивные оцен­
ки мощности читателями, вероятно, будут неправильными, то, что в дан­
ной книге приводятся подсчитанные значения величин, скорее всего, не
будет пустой тратой времени читателей и бумаги.
В психологической литературе, изданной ранее, преобладало согласие при
представлении отчетов, брать, например, выборку размером в среднем, на­
пример, М ±РЕ, где РЕ - вероятная ошибка (то есть, доверительный интер­
вал 50% относительно средней величины). Это соглашение было позже ос­
тавлено в пользу формулировки проверки гипотез. Доверительный интер­
вал, однако, обеспечивает полезный коэффициент для дисперсии выборки,
и именно эту дисперсию мы имеем тенденцию недооценивать. А кцент на
уровнях значимости имеет тенденцию уменьшать фундаментальное разли­
чие между размером результата и его статистической значимостью. Н еза­
висимо от размера выборки, результат в одном исследовании является обо­
снованной оценкой результата при повторении. Напротив, оцененный уро­
вень значимости в повторном эксперименте сильно зависит от размера вы ­
борки. Нереалистичные ожидания относительно воспроизводимости уров­
ней значимости могут быть скорректированы, если будет прояснено разли­
чие между размером и значимостью, и если вычисленный размер наблюда­
емых результатов описан к а к положено. С этой точки зрения, по крайней
мере, принятие модели проверки гипотез не было долгожданным счастьем
для психологии.
Ревностный приверженец закона малых чисел совершает множество гре­
хов против логики статистического вывода с самыми честными намерения­
ми. Гипотеза репрезентативности описывает когнитивный стереотип или
стереотип чувственного восприятия, который действует независимо от мо­
тивации. Таким образом, в то время к ак поспешный отказ от использова­
н и я нулевой гипотезы является привлекательным, отклонение от взлеле­
янной гипотезы, является ухудшающим, все ж е истинный сторонник зако­
на малых чисел зависит и от того, и от другого. Его интуитивные ожидания
подчиняются скорее постоянному неправильному восприятию мира, чем
удобному принятию желаемого за действительное. В ответ на замечания ре­
дакторов, он может решить относиться с надлежащим недоверием к своей ста­
тистической интуиции и заменять впечатления вычислением всякий раз, ког­
да это возможно.
3. Субъективная вероятность:
оценка репрезентативности*

Даниелъ Канеман и Амос Тверски

Субъективная вероятность играет важную роль в нашей ж изни. Решения,


которые мы принимаем, выводы, к которым мы приходим, и объяснения,
которые мы подыскиваем, обычно основаны на наш их суждениях о вероят­
ности неопределенных событий, таких к а к успех на новой работе, результа­
ты выборов или состояние рынка. Действительно, большое количество ли­
тературы по экспериментальным исследованиям было посвящено вопросу,
как люди воспринимают, обрабатывают и оценивают вероятность неопре­
деленных событий, в контексте изучения вероятности, интуитивной стати­
стики и принятия реш ения в условиях риска. И хотя никакой системати­
ческой теории в психологии неопределенности не появилось, благодаря этой
литературе было сформулировано несколько обобщений. Возможно наибо­
лее общий вывод, полученный из многочисленных исследований заклю ча­
ется в том, что люди не следуют принципам теории вероятности в оценке
вероятности неопределенных событий. Вряд ли это заключение можно счи­
тать удивительным, потому что многие из законов случайности не являю т­
ся ни интуитивно очевидными, ни удобными для применения. Менее оче­
видным, однако, является тот ф акт, что отклонения субъективной от объек­
тивной вероятности1 представляются надежными, систематическими, и
кажется, что их тяжело устранить. Очевидно, люди заменяют законы слу­
чайности эвристикой, оценки которой иногда бывают разумными, по очень
часто — нет.
1Мы используем термин “ субъективная вероятность” для обозначения любой оценки веро­
ятности события, которую дает испытуемый, или которая выводится из его поведения. Не
предполагается, что эти оценки, должны удовлетворять каким-либо аксиомам или требова­
ниям последовательности. Мы используем термин “ объективная вероятность “ для обозначе­
ния числовых значений, подсчитанных на основе установленных допущений, согласно зако­
нам вычисления вероятности. Разумеется, эта терминология не совпадает с каким-либо фи­
лософским представлением вероятности.
*Эта глава - сокращенная версия статьи, которая появилась в Cognitive Psychology, 1972,3,430-
454. Авторское право © Academic Press, Inc. 1972. Переиздано в соответствии с разрешением.
50 РЕПРЕЗЕНТАТИВНОСТЬ
В настоящей книге мы подробно исследуем одну из таких эвристик, на­
зываемую репрезентативностью. Человек, который следует этой эвристи­
ке, оценивает вероятность неопределенных событий или выборок, степенью,
в которой они: (1) подобны в своих существенных свойствах исходной сово­
купности; и (2) отражают существенные особенности процесса, с помощью
которого они были созданы. Наш тезис заключается в том, что во многих
случаях, событие А оценивается к ак более вероятное, чем событие В вся­
ки й раз, когда оно каж ется более репрезентативным, чем В. Другими сло­
вами, упорядочивание событий по их субъективной вероятности совпадает
с упорядочиванием их по репрезентативности.
Репрезентативность, к а к подобие при восприятии, легче оценить, чем
охарактеризовать. В обоих случаях, отсутствует общее определение, хотя
существуют случаи, в которых люди выраж аю т согласие в том, какой из
двух стимулов является более похожим на стандарт, или какое из двух со­
бытий более репрезентативно по отношению к данному процессу. В этой
книге мы не измеряем репрезентативность с помощью ш калы , хотя это впол­
не выполнимо. Вместо этого, мы рассматриваем случаи, когда упорядочи­
вание событий по их репрезентативности является очевидным, и показыва­
ем, что люди постоянно оценивают более репрезентативное событие к ак бо­
лее вероятное, независимо от того, так это или нет. Хотя репрезентативность
может играть важную роль во многих суждениях вероятности, например, в
прогнозировании политической ситуации или клиническом диагнозе, су­
ществующий подход ограничен только повторяющимися ситуациями, где
объективные вероятности легко можно вычислить.
Большинство данных, которые упоминаются в этой части книги, собра­
ны в форме анкетного опроса приблизительно 1. 500 респондентов в И зраи­
ле. Испытуемыми были учащиеся 10,11, и 12 классов средне-образователь­
ных ш кол, готовящ ихся к поступлению в высшее учебное заведение (в воз­
расте 15-18 лет). Чтобы привлечь внимание и мотивировать испытуемых,
были приложены специальные усилия. Анкетные опросы были оформле­
ны в виде коротких тестов, проводились в естественной ситуации — в класс­
ной комнате, а имена респондентов были написаны на листах с ответами.
К аж ды й респондент отвечал на небольшое число вопросов (обычно 2-4), на
каж ды й из которых требовалось максимум 2 мин. Было объявлено, что воп­
росы изучают интуицию людей относительно определения шансов. Испы­
туемым давали стандартные устные инструкции, которые подробно объяс­
няли соответствующий вопрос. Процедура проведения опыта была постро­
ена таким образом, чтобы не вызывать ассоциаций с какой-либо школой или
возрастом. Большинство вопросов было предварительно опробовано на сту­
дентах старш их курсов университета (в возрасте 20-25 лет) и результаты,
полученные от этих двух совокупностей, были идентичными.
Субъективная вероятность 51
Д е т е р м и н а н т ы р е п р е зе н т а т и в н о с т и
В этом разделе мы обсудим характеристики выборок или событий, которые
делают их репрезентативными, и демонстрируют их влияние на субъектив­
ную вероятность. Сначала, мы опишем некоторые особенности, которые
определяют подобие выборки ее исходной совокупности, затем мы присту­
пим к анализу детерминантов очевидной случайности.

Подобие выборки и совокупност и


Понятие репрезентативности лучше объяснять на особых примерах. Рас­
смотрим следующий пример.
Были обследованы все семьи в городе, в которых было шестеро детей. В 72 семьях маль­
чики и девочки рождались в таком порядке Д М Д М М Д.
Как вы думаете, в скольких рассмотренных семьях порядок рождения детей был М Д
мммм?
Две последовательности рождений приблизительно одинаково вероятны, но
большинство людей, конечно, согласятся, что они не одинаково репрезен­
тативны. Последовательность с пятью мальчиками и одной девочкой не смо­
жет отразить пропорцию мальчиков и девочек в совокупности. Действитель­
но, 75 из 92 испытуемых оценили, что эта последовательность менее веро­
ятна, чем стандартная последовательность (р < 0.01 согласно тесту знаков).
Средняя оценка была 30. Подобные результаты были сообщены Коен и Хен-
сел (Cohen и Hansel, 1956), а такж е Алберони (Alberoni, 1962).
Можно задаваться вопросом, не игнорируют ли просто испытуемые ин­
формацию о порядке появления детей, и ответить на вопрос, оценив частоту
появления семей с пятью мальчиками и одной девочкой относительно час­
тоты семей с тремя мальчиками и тремя девочками. Однако, когда мы по­
просили, тех ж е самых испытуемых оценить частоту последовательности
М М М Д Д Д, они сочли ее значительно менее вероятной, чем Д М М Д М Д
(р < 0.01), предположительно потому, что первая упомянутая последова­
тельность каж ется менее случайной. Таким образом, порядок появления
детей не игнорируется.
Описанная детерминанта репрезентативности заключается в сохранении
в выборке соотношения меньшинства или большинства такого ж е к ак и в
совокупности. Мы ожидаем, что выборка, которая сохраняет это соотноше­
ние, будет оценена к ак более вероятная, чем выборка, появление которой
(объективно) столь ж е вероятно, но где это отношение нарушено. Этот эф­
фект проиллюстрирован в следующей задаче:
Всредней школе имеются две программы. Мальчиков большинство (65%) в программе
А и меньшинство (45%) в программе В. В каждой из этих двух программ равное число
классов.
Вы входите в класс наугад, и видите, что 55% учеников - мальчики. Как вы предпола­
гаете, этот класс относится к программе А или программе В?
52 РЕПРЕЗЕНТАТИВНОСТЬ
Т ак к а к больш инство учеников в классе - м альч и ки , этот класс более
репрезентативен по отношению к программе А, чем программе В. Соответ­
ственно, 67 из 89 испытуемых предположили, что класс принадлежит про­
грамме А (р < 0.01, по тесту знаков). На самом деле, чуть более вероятно, что
класс принадлежит программе В (так к ак дисперсия выборки для р = 0.45
превышает дисперсию для р = 0.65).
Выборка, в которой представлены разнообразные возможные результа­
ты, вообще, более репрезентативна, чем сравниваемая с ней выборка, в ко­
торой некоторые из возможных результатов отсутствуют. Например, дан­
ный биноминальный процесс с р = 4 /5 значимое большинство испытуемых
оценивают выборку с 10 успехами и 0 неудачами к ак менее вероятную, чем
выборку с 6 успехами и 4 неудачами, хотя первая упомянутая выборка на
самом деле более вероятна.
Влияние стереотипа репрезентативности не сводится только к простым
неподготовленным испытуемым. Этот стереотип также встречается (Tversky
и K ahneman, 1971,2) в интуитивных суждениях опытных психологов. Ста­
тистическая значимость обычно рассматривается к а к подтверждение науч­
ной истины. Следовательно, реальный результат (в совокупности) к ак ож и­
дается, будет представлен значимым результатом (в выборке), практичес­
ки не принимая во внимание размер выборки. Вследствие этого, исследова­
тели склонны переоценивать вероятность значимого результата всякий раз,
когда они полагают, что нулевая гипотеза будет ложной.
Например, участникам заседания Группы Математической Психологии
и Американской Психологической Ассоциации был предложен следующий
вопрос:
Предположим, что Вы проводите эксперимент с 20 испытуемыми, и получили значи­
мый результат, который подтверждает Вашу теорию (z= 2.23, р < 0.05, двусторонний
критерий). Теперь у Вас есть основание провести эксперимент с дополнительной груп­
пой, состоящей из 10 испытуемых. Как Вы думаете, какова вероятность того, что резуль­
таты будут значимыми в тесте с односторонним критерием, отдельно для этой группы?

Реальная оценка желательной вероятности - несколько ниж е 0.50. Сред­


н я я оценка респондентов была 0.85. Эта необоснованная уверенность в вос­
производимости значимости имеет серьезные последствия для проведения
исследования: она приводит к нереалистичным ож иданиям относительно
значимости и результатам планирования исследований, несовершенных в
статистической мощности (см. J . Cohen, 1962).

Отражение случайност и
Д ля того чтобы неопределенное событие было репрезентативным, не доста­
точно, чтобы оно было подобно своей исходной совокупности. Событие так­
ж е должно отражать свойства неопределенного процесса, породившего его,
то есть оно должно казаться случайным. К ак и в случае с подобием выборки
Субъективная вероятность 53
и совокупности, специфические особенности, которые определяют очевид­
ную случайность, различаются в зависимости от контекста. Несмотря на
это, две общих особенности, беспорядочность и локальная репрезентатив­
ность, каж ется, захватывают интуитивное представление о случайности.
Обсудим эти свойства по порядку.
Главная характеристика очевидной случайности - отсутствие системати­
ческих образцов. Последовательность выпадений монеты2, например, кото­
рая очевидно упорядочена - не репрезентативна. Таким образом, чередую­
щиеся последовательности орлов и решек, как, например, ОРОРОРОР или
РРООРРОО, не смогут отразить случайность процесса. Действительно, испы­
туемые считают такие последовательности относительно невероятными и
избегают их в моделировании случайных последовательностей (Time, 1964;
W agenaar, 1970).
Ожидается некоторая неупорядоченность, не только в появлении резуль­
татов, но такж е и в их распределении, к а к показано в следующей задаче:
В каждом туре игры, 20 шариков наугад распределяются среди пятерых детей:
Аланом, Беном, Карлом, Дэном и Эдом.
Рассмотрите следующие распределения шариков:
1. Алан — 4, Бен — 4, Карл — 5, Дэн — 4, Эд — 3.
2. Алан — 4, Бен — 4, Карл — 4, Дэн — 4, Эд — 4.
Если устроить несколько туров игры, какого типа результаты встретятся больше - пер­
вого или второго типа?

Однородное распределение ш ариков (II), объективно более вероятно, чем


неоднородное распределение (I), но все ж е каж ется слишком упорядочен­
ным, чтобы быть результатом случайного процесса. Распределение первого
типа, которое слегка отклоняется от равномерного распределения, являет­
ся более репрезентативным по отношению к случайному распределению.
Подавляющее большинство испытуемых (36 из 52, р < 0.01 по тесту знаков)
сочли распределение первого типа более вероятным, чем распределение II
типа. Присутствие некоторого беспорядка влияет на репрезентативность и,
следовательно, на очевидную вероятность неопределенных событий.
Испытуемые дают ответы на вышеупомянутую задачу, к а к будто они
игнорируют индивидуальный характер этих двух распределений и сравни­
вают, вместо этого, два соответствующих класса распределений, игнорируя
каждое отдельное распределение ш ариков детям. Это не означает, что ис­
пытуемые не оценивают различие между классом и его представителями.
Что они все-таки не оценивают - это надлежащ ее воздействие этого разли­
чия на оценку относительной частоты.
Люди рассматривают шанс к ак непредсказуемый, но по сути справедли­
вый. Таким образом, они ожидают, что в абсолютно случайном распределе­
нии шариков каж ды й ребенок получит приблизительно (хотя и не точно)

В этой книге мы рассматриваем только сбалансированные монеты.


54 РЕПРЕЗЕНТАТИВНОСТЬ
одинаковое число шариков. Точно так ж е они ожидают, что даже короткие
последовательности подбрасываний монеты, будут содержать относитель­
но одинаковое количество «орлов» и «решек». Вообще, репрезентативная
выборка - эта та, в которой существенные характеристики исходной сово­
купности представлены в целом не только в полной выборке, но такж е и
локально в каждой из ее частей. Выборка, репрезентативная локально, од­
нако, систематически отклоняется от ож иданий шансов: в ней слиш ком
много изменений и слиш ком мало группировок.
Закон больших чисел гласит, что очень большие выборки высоко репре­
зентативны по отношению к совокупности, из которой они взяты. В другом
случае (Tversky и K ahneman, 1971,2), мы охарактеризовали ожидание ло­
кальной репрезентативности к а к приверженность закону малы х чисел, со­
гласно которому “закон больших чисел применим такж е и к малым чис­
лам ”. Эта убеждение, к а к мы предполагаем, леж ит в основе ошибок интуи­
ции относительно случайности, которая представлена в широком разнооб­
разии контекстов.
Исследования восприятия случайности (например, Tune, 1964; W agenaar,
1970) показывают, что, когда людей просят смоделировать случайный про­
цесс, такой к а к серии подбрасываний монеты, они создают последователь­
ности, которые являю тся репрезентативными локально, с большим коли­
чеством коротких отрезков. Более того, люди имеют тенденцию рассматри­
вать к а к маловероятные, или отклонять к ак неслучайные последователь­
ности, которые имеют правильное распределение на длине отрезка, возмож­
но, потому что длинные отрезки не репрезентативны локально.
Подобные результаты такж е были получены в сотнях исследований, изу­
чаю щ их вероятность и бинарное прогнозирование (Estes, 1964; М. R. Jones,
1971) . Ошибка игрока в казино или эффекта отрицательной новизны яв л я ­
ется проявлением убежденности в локальной репрезентативности. Посколь­
ку, если соотношение этих двух результатов сохраняются на коротких от­
резках, то за длинной последовательностью одного результата для восста­
новления равновесия должен идти другой результат. В мире, где действует
локальная репрезентативность, фактически, ошибка игрока в казино боль­
ше не является ошибкой.
В своем Введении в Теорию Вероятности, Феллер (1968, р. 160) описы­
вает пример, который иллюстрирует ошибочную веру в локальную репре­
зентативность. Во время интенсивной бомбежки Лондона во Вторую Миро­
вую войну, считалось вообще, что выбор целей бомбежки не может быть слу­
чайным, потому что некоторые районы города были поражены несколько
раз, в то время к а к на многие другие бомбы не падали совсем. Таким обра­
зом, рисунок попаданий бомб наруш ил закон локальной репрезентативнос­
ти, и гипотеза случайности попаданий казалась недопустимой. Чтобы про­
верить эту гипотезу, всю территорию Юга Лондона разделили на маленькие
области равной площади, и фактическое распределение попаданий в этом
районе сравнили с ожидаемым (пуассоновским) распределением согласно
Субъективная вероятность 55
предположению о том, что бомбежка велась по случайному принципу. Воп­
реки общим ожиданиям, соответствие между распределениями было очень
сильным. “Д ля нетренированного глаза, - замечает Феллер, - случайность
каж ется упорядоченностью или тенденцией к группировке”.
Большинство студентов удивляются, когда узнают, что в группе, состоя­
щей только из 23 человек, вероятность того, что, по крайней мере, у двух из
них день рождения в один и тот ж е самый месяц и день, превышает 0.5.
Ясно, что при выборке в 23 человека, ожидаемое количество дней рожде­
ния в один день - меньше чем 1/15. Таким образом, день с двумя днями рож ­
дения, а такж е наличие 343 “пустых” дней, - очень нерепрезентативны, и
рассматриваемый случай, поэтому, каж ется маловероятным. Обобщая, мы
считаем, что характер многих результатов в теории вероятности, противо­
речащий интуиции, относится к наруш ениям репрезентативности. (Для
убедительного прим ера из теории случайны х ш агов, см. F eller, 1968,
стр. 84-88.)
Репрезентативная выборка, в таком случае, является подобной совокуп­
ности в своих существенных характеристиках, и отражает случайность та­
кой, как ее видят люди; то есть все ее части репрезентативны, и ни одна из
них не является слишком упорядоченной. Только немногие из всех возмож­
ных выборок удовлетворяют всем этим ограничениям. Большинство выбо­
рок — нет, и поэтому они не каж утся случайными. Среди 20 возможных
последовательностей шести подбрасываний монеты, например, мы риску­
ем столкнуться с тем, что только выборка О Р Р О Р О окаж ется действитель­
но случайной. Подбросив монету 4 раза, мы можем не получить подобной
последовательности.
Тенденция расценивать некоторые двоичные последовательности к ак
более случайные, чем другие, имела драматические последствия для экспе­
римента на радио Зенит3, в котором аудитории было предложено предполо­
жить значения пяти двоичных символов, которые были “телепатированы”
им группой радиовещания. Анализ более чем миллиона ответов (Goodfellow,
1938) показал, что число выборов для некоторых последовательностей зна­
чительно превышало их вероятность, а для других было существенно зани­
жено, причем оно в значительной степени зависело от очевидной случайно­
сти входящ их («телепатированных») последовательностей. Значение этих
результатов для ESP исследований является очевидным.
Последовательности, каж утся случайными, когда словесное описание
наиболее длинное. Вообразите, что Вы диктуете длинную последователь­
ность двоичных символов, например, орлов и решек. Вы будете, несомнен­
но, использовать сокращенные выражения типа «четыре решки» или «Орел-
Реш ка три раза подряд». Последовательность с большим количеством по­
вторяющихся подряд символов, позволяет использовать сокращ ения пер­

3Мы благодарим R. Р. Abelsona за предоставление нам своего исследования.


56 РЕПРЕЗЕНТАТИВНОСТЬ
вого типа. Структура таких отрезков, похожих на случайные, минимизи­
рует полезность таких сокращений, и, следовательно, не поддается эконо­
мичным описаниям. Очевидная случайность, поэтому, является разновид­
ностью сложности структуры. Детерминанты сложности структуры, такие
к а к кодируемость (G arner 1970; G lanzer & Dark, 1963; Vitz и Todd, 1969)
такж е принимают вид очевидной случайности.

Распределение вы борок
Мы предположили, что испытуемые оценивают вероятность события таким
образом, чтобы более репрезентативным событиям приписывать более высо­
кие вероятности, а одинаково репрезентативным событиям - равные вероят­
ности. В этом параграфе мы исследуем значение этой гипотезы для изучения
субъективных распределений выборок, то есть, вероятность того, что испы­
туемые возьмут выборки данного размера из указанной совокупности.
Когда выборка описана в терминах единичной статистики, например,
пропорции или среднего, то степень, в которой она репрезентативна сово­
купности, определяется подобием этой статистики соответствующему па­
раметру совокупности. Так к ак размер выборки не отражает никакой спе­
цифической особенности исходной совокупности, он не ассоциируется с реп­
резентативностью. Таким образом, событие, в котором обнаруживается боль­
ше чем 600 мальчиков в выборке из 1. 000 младенцев, например, столь ж е
репрезентативно, к ак обнаружение больше чем 60 мальчиков в выборке из
100 младенцев. Поэтому, два эти события, были бы оценены к ак равноверо­
ятные, хотя последнее, на самом деле, значительно более вероятно. Точно
так ж е согласно данному анализу, субъективная вероятность того, что сред­
ний рост в выборке людей — между 6 футами 0 дюймами и 6 футов 2 дюйма­
ми будет независима от размера выборки.
Чтобы проверять эти прогнозы, девять различных групп испытуемых
воспроизвели субъективные распределения выборок для трех размеров вы ­
борки (N = 1 0 ,1 0 0 ,1 . 000) и для каждой из следующих трех совокупностей.
Распределение полов. (Биномиальное, р = 0.50) Испытуемым сказали, что
каж ды й день рождается приблизительно N младенцев в определенном ре­
гионе. Д ля N = 1. 000, например, вопрос, звучал так:
Каков процент дней, в которые число мальчиков среди 1.000 младенцев будет следую­
щим:
До 50 мальчиков
от 50 до 150 мальчиков
от 150 до 250 мальчиков

От 850 до 950 мальчиков


Больше чем 950 мальчиков
Обратите внимание, что эти категории учитывают все возможности, так что сум­
ма процентов в Ваших ответах должна составить в целом приблизительно 100%.
Субъективная вероятность 57
0.24
яшт N»10
| 0.22
| °-20
« 0.18

5 0.16
* 0.14
о 0.12
S 0.10
| 0.08
® 0.06
CL
и 0.04
0.02
vP
о4*
ID
vO
O '"
ID ID
nP

ID
\P
ID
nP

in
sO
o4
ID ID
s?
ID
sp
О
CM CO ID <o r*» OO
1
CT> О
ID ID in in in ID ID ID ID V
CM CO in C- OO ID
O)

Категории

Рис. 1. Распределение полов

Д ля N = 100, эти 11 категорий были: до 5, 5-15, и т.д.


Д ля N = 10, каж дая категория содержала единичный результат, напри­
мер, 6 мальчиков.
Распределение типа сердцебиения. (Биномиальное, р = 0.80) В этом слу­
чае, испытуемым сказали, что каж ды й день в некоторой области рождают­
ся приблизительно N младенцев, и что 80% всех новорожденных имеет серд­
цебиение типа а , а остальные 20% имеют сердцебиение типа ß.
Для каждого размера выборки, испытуемые произвели распределения вы ­
борок для количества младенцев, рожденных каж ды й день, с сердцебиени­
ем типа а , используя 11 категорий к а к те, что приведены выше.
Распределение роста. Испытуемым сказали, что региональный военко­
мат делает учет среднего роста N количества людей, которых обследуют к а ж ­
дый день. Им также сообщили, что средний рост мужчин в совокупности —
между 170-175 см (в Израиле рост измеряется в сантиметрах), и что частота
появления различного уровня роста уменьшается по мере удаления от сред­
него. Д ля каждого размера выборки испытуемые воспроизвели распределе­
ние выборки людей среднего роста, в следующих семи категориях: до 160,
160-165,..., больше 185.
58 РЕПРЕЗЕНТАТИВНОСТЬ

Категории
Рис. 2. Распределение типов сердцебиения

Средняя оценка для этих трех совокупностей, соответственно, показана


на рисунках 1 ,2 и 3 для всех трех значений N. (Размер группы варьировал­
ся от 45 до 84, со средним - 62.) Очевидно, что размер выборки вообще не
оказывает никакого влияния, независимо от субъективных распределений
выборок. Независимые группы тестируемых, которые решали задачи, от­
личающ иеся друг от друга только размером выборки, производят совершен­
но одинаковые распределения. Этот результат остается тем ж е и для сово­
купностей, определенных абстрактно, например, биномиальные, такж е к ак
для совокупностей, которые известны испытуемым из их ежедневного опы­
та, например, рост людей.
Так к а к субъективные распределения выборок независимы от N, сплош­
ные линии на каждом графике, которые соединяют значения средних оце­
нок, могут рассматриваться к а к “универсальные” распределения выборок
для соответствующей совокупности. Д ля изображения того, насколько в дей­
ствительности размер выборки влияет на распределение, который испыту­
емые полностью игнорируют, показаны правильные распределения выбо­
рок для р = 0.50 и р = 0.80, вместе с соответствующим “универсальным”
распределением выборок, на Рисунках 4 и 5, соответственно.
Можно заметить, что “универсальные” кривые даже ровнее, чем правиль­
ные кривы е для N = 10. Д ля р = 0.50, “универсальная” дисперсия (0.048)
грубо р ав н а норм альной дисперсии д л я вы борки д ля N = 5 (0.05). Д л я
р = 0.80, дисперсия “универсальной” кривой (0.068) находится между нор­
мальной дисперсией выборки для N = 2 и N = 3.
Субъективная вероятность 59

Рис. 3. Распределение роста

В биномиальных распределениях, средняя величина вообще совпадает с


модой. Следовательно, когдар * 0.50, короткий «хвост» должен быть боль­
ше, чем длинный; см., например, правильное распределение для N = 10 на
Рисунке 4. Рисунок 4 такж е показывает, что это свойство нарушено “уни­
версальной” кривой для р = 0.80, чье среднее равно только 0.63. Таким об­
разом, хотя мода в субъективном распределении выборок должным обра­
зом расположена в области наиболее репрезентативной величины, средняя
величина смещена к длинному «хвосту ». Тот ж е самый результат был полу­
чен и в других исследованиях, например, Cohen и Hansel (1956), P eterson,
DuCharme и Edw ards (1968). Таким образом, д ля р = 0 .8 0 “универсальное”
выборочное распределение пропорции - вообще не биномиальное!
Следующий эксперимент отличается от предыдущих субъективных бино­
минальных распределений (Peterson, DuCharme и Edwards, 1968; W heeler &
Beach, 1968). Сначала в более ранней работе описывались размеры выборок,
намного меньшие, чем размеры выборок данного исследования. Во-вторых,
что является более важным, число событий, для которых были распределе­
ны вероятности, не было одинаковым для различных размеров выборок: для
выборки размера N, испытуемые оценивали N + 1 результатов. В данном ис­
следовании, напротив, испытуемые оценивают то ж е самое число категорий
для всех размеров выборки. Неизменность субъективного распределения
выборки относительно N, которая показана на Рисунках 1, 2 и 3, не может
оставаться той ж е самой, когда изменяется число категорий, или когда вы­
борка достаточно маленькая, чтобы шансы можно было задать перечислени­
ем. Д ля больших выборок, задание всех шансов перечислением невозможно,
60 РЕПРЕЗЕНТАТИВНОСТЬ

Рис. 4. Распределение выборок р =0.50


и вполне естественно обращение к прямой оценке репрезентативности, на
которую влияет среднее выборки, или пропорция выборки.
Чтобы далее исследовать прогнозирование репрезентативности относи­
тельно размера выборки, был проведен дополнительный эксперимент. В
качестве испытуемых были 97 студентов старших курсов Стэнфорда без
какой-либо подготовки в теории вероятности или статистике, собранные в
маленькие группы от 5 до 12 человек в каждой. Им были предоставлены, в
установленном порядке, три задачи, каж дая из которых определяла собой
процесс формирования выборки с указанным средним и критической вели­
чиной, которая была выше этого среднего, и их попросили оценить, являет­
ся ли отдельно взяты й результат выборки более вероятным в большой или в
маленькой выборке. Каждому испытуемому заплатили $ 1 за участие в экс­
перименте и еще один дополнительный $ 1, если его ответ на одну из задач
(отобранный наугад после завершения задания) был правильным.
Чтобы контролировать предубеждения ответа, каж дая задача была пред­
ставлена в двух формах. Половина испытуемых оценивала, для всех трех
задач, является ли более вероятным, что исход, который более экстрема­
лен, чем указанная критическая величина, встретится в маленькой или в
большой выборке. Правильный ответ, конечно, - то, что экстремальный ис­
ход, более вероятно, встретится в маленькой выборке. Остальные испытуе­
мые оценили, что более вероятно: если результат, который является менее
экстремальным, чем указанная критическая величина, встретится в малень­
кой или в большой выборке. Правильный ответ здесь - то, что такой резуль­
тат, более вероятно, встретится в большой выборке. Данные три задачи пред­
ставлены ниже. Указанные числа - количество испытуемых, которые выб-
Субъективная вероятность 61

Рис. 5. Распределение выборки р = 0.80

рали каждую категорию ответа, для каждой из двух форм. Правильные от­
веты помечены звездочками.
1. Некий город обслуживается двумя больницами. В большей больнице каждый день
рождается приблизительно 45 младенцев, а в меньшей больнице каждый день рожда­
ется приблизительно 15 младенцев. Как Вы знаете, приблизительно 50% всех младен­
цев - мальчики. Точный процент мальчиков-младенцев, однако, изменяется со дня на
день. Иногда он может быть выше, чем 50%, иногда понижаться.

Больше чем 60 Меньше чем 60


% %
Большая больница 12 9*
Маленькая больница 10* 11
Примерно поровну (т.е. в пределах 5% 28 25
разницы)

В течение 1 года каждая больница вела учет дней, в которые (больше / меньше) чем
60% рожденных младенцев были мальчики. Какая больница, как Вы думаете, сделала
учет большего количества таких дней?

2. Исследователь, изучающий некоторые свойства языка, взял книгу в мягкой облож­


ке и вычислил среднюю длину слова на каждой странице книги (то есть, количество
букв на той странице, поделенное на количество слов). Другой исследователь взял пер­
62 РЕПРЕЗЕНТАТИВНОСТЬ
вую строку на каждой странице и вычислил среднюю длину слова в строке. Средняя
длина слова во всей книге - четыре. Однако, не в каждой строке или на странице точно
такая же средняя длина слова. В некоторых средняя длина слова может быть больше
или меньше.

Больше в Меньше в

Ученый, исследовавший страницы 8 10*


Ученый, исследовавший строки 21* 15
Примерно поровну (т.е. в пределах 5%
разницы) 20 23

Первый исследователь сосчитал количество страниц, на которых средняя длина сло­


ва 6 или (больше / меньше), а второй исследователь сосчитал количество строк, в кото­
рых средняя длина слова 6 или (больше / меньше). Какой исследователь, как Вы дума­
ете, сделал запись большего количества таких единиц (страницы для одного, строки
для другого)?

3. Проводится медицинское обследование, с целью изучения некоторых факторов, вли­


яющих на коронарные заболевания. Две группы собирают данные. Одна обследует по
три человека в день, а другая - одного человека. Эти люди выбраны наугад из совокуп­
ности. Во время осмотра замеряется рост каждого человека. Средний рост взрослого
мужчины 5 футов 10 дюймов. Людей, чей рост выше среднего, столько же, сколько и
людей, чей рост ниже среднего.

Больше 5 футов Меньше 5 футов


11 дюймов 11 дюймов
Команда, проверявшая по 3 человека в 7 14*
день
Команда, проверявшая по одному
18* 17
человеку в день
Примерно поровну (т.е. в пределах 5% 23 17
разницы)
Группа, проверяющая трех человек в день, оценивает их рост, и отмечает дни, когда
средняя величина роста человека была (больше / меньше) чем 5 футов 11 дюймов, дру­
гая группа просто считает дни, когда человек, которого они проверили, был (выше\ни-
же) 5 футов 11 дюймов. Какая команда, как Вы думаете, насчитала большее количе­
ство таких дней?

Если бы у испытуемых было какое-то понимание роли размера выборки,


они должны были бы без труда выбрать правильные ответы на эти простые
вопросы. С другой стороны, если они считают, что одинаково репрезента­
тивные результаты в равной степени вероятны, они не должны проявлять
какого-либо систематического предпочтения правильному ответу. И это ясно
видно из примеров. Модальный ответ - “поровну” почти во всех примерах;
Субъективная вероятность 63
кроме того, в любой из задач нет никакого существенного предпочтения пра­
вильному ответу.
Этот эксперимент подтверждает заклю чения первоначального исследо­
вания, несмотря на некоторые процедурные р азли чия. Здесь, каж ды й
субъект прямо оценивает вероятность результата, имея выборки двух раз­
меров при условиях, разработанных, таким образом, чтобы стимулировать
его давать правильные ответы. Эта процедура должна увеличить вырази­
тельность такой характеристики выборки, к ак размер. Кроме того, после­
дняя задача сравнивает единичное наблюдение со средней величиной вы ­
борки из трех наблюдений. Как было показано, респонденты не смогли за­
метить даже тот очевидный факт, что средние величины должны быть ме­
нее изменчивыми, чем единичные наблюдения.
Понятие, что разнообразие элементов выборки уменьшается с увеличе­
нием количества элементов выборки, очевидно, не является частью интуи­
тивных представлений человека. Действительно, неправильные представ­
ления о роли типового размера часто проявляются в ежедневной ж изни. С
одной стороны, люди часто принимают всерьез результат, выраженный в
процентах, не заботясь о количестве наблюдений, которое может быть сме­
хотворно маленьким. С другой стороны, люди часто остаются скептически­
ми перед лицом неоспоримого свидетельства из большой выборки. Как в слу­
чае известного политического деятеля, который горько жаловался, что сто­
имость проживания не основана на данных о целом населении, а только на
большой выборке, и добавил, “И что еще хуже, на случайной выборке “.
Конечно, мы не хотим сказать, что человек не способен понять влияние
размера выборки на разнообразие ее элементов. Людей можно научить вер­
ному правилу, возможно даже почти без труда. Дело в том, что люди не следу­
ют этим правилам, когда предоставлены сами себе. Более того, изучение по­
ведения психолога-исследователя (J. Cohen, 62, Tversky и Kahneman, 1971,
2) показывает, что сильная тенденция недооценивать влияние размера вы­
борки не исчезает, несмотря на знание верного правила и обширного обуче­
ния в области статистики. Любого, кто хотел бы рассматривать человека к ак
разумного интуитивного статистика, такие результаты обескураживают.

Н ормативные модели и дескриптивны е эвристики


Существует мнение (см., например, W . Edwards, 1968,25), что человек, во­
обще говоря, следует правилу Байеса, но не в состоянии оценить полное воз­
действие очевидности, и поэтому - консервативен. Петерсон и Бич, напри­
мер, сделали вывод, что нормативная модель обеспечивает хорошее первое
приближение к поведению испытуемых, которые находятся “под влияни­
ем определенных переменных и в определенных направлениях” (Peterson и
Beach, 1967, с. 43). Это точка зрения не была разделена всеми. В более со­
временном обзоре литературы, Словик и Лихтенштейн (Slovic и Lichtenstein,
1971) доказывали, что выш еупомянутая оценка поведения человека к ак
64 РЕПРЕЗЕНТАТИВНОСТЬ
интуитивного статистика “слишком щ едра,”, в то время к ак Пиц, Даунинг
и Рейнхольд приш ли к выводу, на основе своих данных, что человеческое
поведение в задачах Байеса “неоптимально в более фундаментальном смыс­
ле, чем подразумеваются в обсуждениях консерватизма” (Pitz, Downing и
Reinhold, 1967, с. 392).
Польза, которую может принести нормативный подход Байеса анализу
и моделированию субъективной вероятности зависит, прежде всего, не от
точности субъективных оценок, а скорее от того, охватывает ли модель су­
щественные детерминанты процесса суждения. Исследование, которое об­
суждается в этой книге, показывает, что это не так. В частности мы видели,
что размер выборки не оказывает влияния на субъективные распределения
выборок, что последующие биномиальные оценки определены (по крайней
мере, в общем случае) скорее пропорцией выборки, чем разнообразием эле­
ментов выборки, и что они не зависят от пропорции совокупности. В своей
оценке очевидности человек - вероятно не консервативный последователь
Байеса: он - не последователь Байеса вовсе.
Я вляется спорным, что неспособность нормативной модели описать че­
ловеческое поведение свойственна только для неопытных испытуемых, ко­
торые столкнулись с незнакомыми случайными процессами, и что она мог­
ла бы обеспечивать адекватную оценку более знакомых случайных процес­
сов, с которыми люди сталкиваются в повседневной ж изни. Имеется мало
подтверждений, однако, которые могли бы засвидетельствовать это мнение.
Сначала, было показано (Tversky и K ahnem an, 1971,2), что те ж е самые си­
стематические ошибки, предложенные соображениями репрезентативнос­
ти, могут обнаружиться в интуитивных суж дениях хорошо обученных уче­
ны х. Очевидно, знакомство с теорией вероятности не устраняет все ошибки
интуиции относительно законов случая. Во-вторых, в наш ей повседневной
ж изни мы сталкиваемся с многочисленными случайными процессами (на­
пример, рождение мальчика или девочки, красный свет светофора на пере­
крестке, набор карт без единой карты червовой масти), которые подчиня­
ются биномиальному закону, например, в высокой степени приближения.
Люди, однако, будут не в состоянии извлечь адекватную концепцию бинар­
ного процесса из этого опыта. Очевидно, использование постоянных много­
численных проверок не приводит к оптимальному поведению.
В своей ж изни люди задают себе и другим вопросы типа: Какова вероят­
ность того, что этот 12-летний мальчик вырастет и станет ученым? Какова
вероятность, что этот кандидат будет принят на службу? Какова вероятность,
что эта компания уйдет из бизнеса? Эти проблемы отличаются от тех, кото­
рые обсуждались ранее в этой книге тем, что в силу их уникального харак­
тера, их нельзя решить ни в терминах частоты возникновения в прошлом,
ни в терминах некоторого четкого процесса осуществления выборки.
В этой книге, мы довольно детально исследовали одну эвристику, соглас­
но которой вероятность события определяется степенью, в которой оно
репрезентативно по отношению к главным характеристикам процесса или
Субъективная вероятность 65
совокупности, из которой оно взято. Хотя наш и примеры исследований были
ограничены четкими процессами осуществления выборки (где объективная
вероятность легко вычислима), мы считаем, что точно такая ж е эвристика
играет важную роль в оценке неопределенности в уникальны х ситуациях,
где никакой “правильный” ответ не доступен. Вероятность того, что отдель­
но взяты й 12-летний мальчик станет ученым, например, может быть опре­
делена степенью, в которой роль ученого репрезентативна по отношению к
нашему представлению об этом мальчике. Точно так ж е, когда мы размыш ­
ляем о вероятности того, что компания уйдет из бизнеса, или что полити­
ческого деятеля назначат на должность, у нас в голове есть модель компа­
нии или политической ситуации, и мы оцениваем к а к наиболее вероятные
те результаты, которые лучше всего представляют существенные особенно­
сти соответствующей модели....
4. О психологии прогнозирования*

Даниелъ Канеман и Амос Тверски

В этой части книги мы рассматриваем правила, которые определяют интуи­


тивные прогнозы и оценки достоверности, и сопоставляем их с норматив­
ны ми принципами статистического прогнозирования. Предлагаются два
вида прогнозов: прогнозирование категории и числовое прогнозирование.
При прогнозировании категории, предсказание осуществляется в номиналь­
ной форме, например, победитель на выборах, диагноз пациента или буду­
щ ая профессия человека. При числовом прогнозировании, предсказание
дается в числовой форме, например, котировка акций или средняя оценка
успеваемости студента.
При прогнозировании и принятии решений в условиях неопределеннос­
ти, людям не свойственно определять вероятность исхода или прибегать к
статистической теории прогнозирования. Вместо этого, они полагаются на
ограниченное число эвристик, что иногда приводит к верным суждениям, а
иногда влечет за собой серьезные и систематические ошибки (Kahneman &
Tversky, 1972b, 3; Tversky & K ahnem an, 1971,2; 1973,11). В этой книге мы
рассматриваем роль в интуитивных прогнозах одной из таких эвристик - реп­
резентативности.
При наличии определенных данных (например, краткого описания лич­
ности), соответствующие исходы (например, род занятий или уровень дости­
жений) можно определить степенью, в которой они репрезентативны по от­
ношению к этим данным. Мы утверждаем, что люди прогнозируют на основе
репрезентативности, то есть выбирают или предсказывают последствия, ана­
лизируя степень, в которой исходы отражают существенные особенности ис­
ходных данных. Во многих ситуациях репрезентативные последствия дей­
ствительно более вероятны, чем другие. Однако это не всегда так, потому что
существует ряд факторов (например, априорные вероятности исходов и на­

*Эта глава впервые появилась в Psychological Review, 1973,80,237-251. Авторское право©


1973
О психологии прогнозирования 67
дежность первичных данных), которые влияют на вероятность исходов, а не
на их репрезентативность. Поскольку эти факторы люди не принимают во
внимание, то их интуитивные предсказания систематически и существенно
нарушают статистические правила прогнозирования.
Чтобы подтвердить эту гипотезу, мы покажем, что предсказание исхо­
дов н а основе кажущ егося подобия совпадает с их предсказанием на основе
репрезентативности, и что априорная вероятность и ожидаемая точность
прогноза, по существу, не влияю т на интуитивные предсказания.
В первой части мы исследуем прогнозирование категории и демонстри­
руем, что оно подчиняется независимой оценке репрезентативности и по
существу не зависит от предшествующих вероятностей исходов. В следую­
щей части мы исследуем числовое прогнозирование и показываем, что оно
недостаточно регрессивно и на него существенно не влияют соображения
достоверности. Следующие три части описывают, соответственно, методо­
логические проблемы в изучении прогнозирования, источники необоснован­
ной уверенности по поводу прогнозов и некоторые ошибочные прогнозы от­
носительно эффектов регресса.

П р о гн о зи р о в а н и е к а т е г о р и и

Базовое значение, подобие и вероятность


Следующий экспериментальный пример иллюстрирует прогнозирование
репрезентативности и ошибки, связанные с этим способом интуитивного
прогнозирования. Группе из 69 испытуемых1 (группа базового значения)
задали следующий вопрос: “Возьмем всех аспирантов первого курса в США
на сегодняшний день. Какой процент студентов, по Вашему мнению, задей­
ствован в каждой из девяти областей специализации? Области специализа­
ции представлены в Таблице 1. Первая колонка этой таблицы представляет
средние оценки базового значения для различных областей.
Второй группе из 65 испытуемых (группа подобия) предложили следую­
щее краткое описание личности:
Том В. обладает высоким интеллектом, но ему не хватает творческого потенциала. Он
любит порядок и ясность и нуждается в системе, где каждая мелочь находится на своем
месте. Манера письма — однообразная и механическая, иногда оживляется несколько
банальными каламбурами и вспышками воображения подобно произведениям науч­
ной фантастики. Имеет сильную тягу к устойчивому материальному положению. Про­
являет мало сочувствия и симпатии к другим людям, не любит взаимодействовать с
другими. Будучи эгоцентричным, тем не менее, имеет глубокое чувство морали.

1При отсутствии дополнительных уточнений, под испытуемыми следует понимать оплачи­


ваемых добровольцев, привлеченных через студенческую газету в Университете штата Оре­
гон. Данные были собраны в классах для групповых занятий.
68 РЕПРЕЗЕНТАТИВНОСТЬ
Испытуемых попросили проанализировать девять областей науки с точки
зрения того, “насколько подобен Том В. типичному аспиранту каж дой из
областей науки? “ Во второй колонке Таблицы 1 представлены средние зна­
чения подобия, соответствующие различным областям науки.
Наконец, группе прогнозирования, состоящей из 114 аспирантов-пси-
хологов трех крупных университетов Соединенных Штатов, было представ­
лено краткое описание личности Тома В. со следующей дополнительной
информацией.
Предыдущее краткое описание личности Тома В. было составлено психологом на осно­
вании проективного теста, когда Том был старшеклассником средней школы. В насто­
ящее время Том В. - аспирант. Расположите следующие девять областей специализа­
ции аспирантов в порядке вероятности того, что Том В. является теперь аспирантом в
одной из этих областей.

Таблица 1. Оценки базовых значений для девяти областей специализа­


ции и краткое описание данных подобия и прогнозирования для Тома В.

Среднее
Средняя Средняя
Специализация аспирант а базовое
величина величина
значение
подобия вероят ност и
(в %)
Управление бизнесом 15 3.9 4.3
Программирование/
информатика 7 2.1 2.5
Технические науки 9 2.9 2.6
Гуманитарные науки и
педагогика 20 7.2 7.6
Юриспруденция 9 5.9 5.2
Библиотекарское дело 3 4.2 4.7
Медицина 8 5.9 5.8
Физика и естественные
науки 12 4.5 4.3
Социальные науки 17 8.2 8.0

Третья колонка Таблицы 1 отражает средние величины исходов, полу­


ченных испытуемыми в группе прогнозирования.
Позже было рассчитано произведение моментов между колонками Таб­
лицы 1 (корреляция Пирсона). Корреляция между вероятностью и подоби­
ем составила - 0.97, в то время к а к корреляция между вероятностью и ба­
О психологии прогнозирования 69
зовым значением2- 0.65. Очевидно, что суждения вероятности по существу
совпадают с суждениями подобия и существенно отличаются от суждений
базового значения. Полученный результат является прямым подтвержде­
нием гипотезы, что люди делают прогнозы, опираясь на репрезентативность
или подобие.
Вероятностные суждения аспирантов-психологов грубо нарушают нор­
мативные правила прогнозирования. Более 95% респондентов предположи­
ли, что Том В., вероятнее всего, изучает информатику, чем гуманитарные
науки или педагогику, хотя они твердо знали, что в последней области ас­
пирантов намного больше. Согласно оценкам базового значения, отражен­
ным в Таблице 1, исходная разница между гуманитарными науками и ин­
форматикой — приблизительно 1 к 3 (реальная разница намного больше).
Согласно правилу Байеса, можно преодолеть первоначальное противо­
речие, позволяющее Тому В. заниматься информатикой, а не гуманитар­
ными дисциплинами и педагогикой, если описание его личности является
одновременно и точным, и диагностическим. Однако, аспиранты, приняв­
шие участие в нашем исследовании, не считали, что эти условия были вы­
полнены. После выполнения задачи прогнозирования, респондентов попро­
сили подсчитать процент правильных ответов (то есть, исправить свой пер­
воначальный выбор среди девяти областей специализации), который мож ­
но было бы достичь, при наличии у них нескольких типов информации.
Средние значения правильных ответог составили 23% для прогнозов, осно­
ванных на проективных тестах, для сравнения с 53% , для прогнозов, осно­
ванных н а сообщениях старшеклассников средней ш колы касательно их
интересов и планов. Очевидно, проведение проективны х испы таний не
пользовалось большим доверием. Однако аспиранты полагались на описа­
ние, полученное из таких испытаний, и не принимали во внимание базовые
значения.
В общем, для статистического прогнозирования важ ны три типа инфор­
мации: (а) первичная или фоновая информация (например, базовые значе­
ния областей специализации выпускников ВУЗов); (б) дополнительная ин­
формация для отдельного взятого случая (например, описание Тома В.); (в)
ожидаемая точность прогноза (например, априорная вероятность правиль­
ных ответов). Фундаментальное правило статистического прогнозирования
гласит, что ожидаемая точность влияет на удельный вес, приписываемый
дополнительной и первичной информации. При уменьшении ожидаемой
точности, предсказания должны становиться более регрессивными, то есть
близкими к прогнозам, основанным на первичной информации. В случае
Тома В., ожидаемая точность была низкой, и испытуемым следовало опи­
раться на априорную вероятность. Вместо этого, они делали прогнозы, на

2 При вычислении этой корреляции, оценки были инвертированы таким образом, чтобы
высоко оцененной вероятности соответствовало высокое значение.
70 РЕПРЕЗЕНТАТИВНОСТЬ
основе репрезентативности, то есть они прогнозировали исходы по их подо­
бию дополнительной информации, не принимая во внимание априорную
вероятность.
Испытуемые в группе прогнозирования целиком полагались на краткое
описание личности, и, очевидно, не принимали во внимание следующие со­
ображения. Во-первых, учитывая известную неадекватность проективного
тестирования личности, вполне вероятно, что Том В. действительно не стра­
дал навязчивыми стремлениями и не был таким равнодушным, как пред­
полагает его описание. Во-вторых, даже если описание соответствовало дей­
ствительности, когда Том В. был учащ имся средней ш колы, оно могло стать
ложным при поступлении в аспирантуру. Наконец, даже если описание все-
таки достоверно, очевидно, что под него подходит больше студентов, изуча­
ющ их гуманитарные науки и педагогику, чем студентов, изучающих ин­
форматику, просто потому что в первой области студентов намного больше,
чем в последней.

М а н и п у л я ц и я ожидаемой точностью
Гипотезой проведенного нами дополнительного исследования являлось то,
что вопреки статистической модели, манипуляция ожидаемой точностью
не затрагивает структуру прогнозов. Экспериментальный материал состо­
ял из пяти кратких описаний личности мальчиков-девятиклассников, пред­
положительно составленных консультантом-психологом на основе интер­
вью к ак части лонгитюдного исследования. Описания были построены так­
ж е, к ак и в исследовании с Томом В. Д ля каждого описания, испытуемые
первой группы (N - 69) рассмотрели девять областей специализации аспи­
рантов (см. Таблицу 1) относительно соответствия отдельно взятого маль­
чика “образу типичного аспиранта-первокурсника в данной области”. Опи­
раясь на суждения подобия, они оценили частоту базового значения девяти
областей специализации аспирантов. Результаты представлены в Таблице 1.
Оставшимся испытуемым сообщили, что эти описания были наугад отобра­
ны из числа участников первоначального исследования, которые теперь
являю тся аспирантами-первокурсниками. Группе с высокой точностью
(N = 55), указали, что “на основе данных описаний, испытуемые студенты
делают правильные прогнозы приблизительно в 55% случаев”. Группе с низ­
кой точностью (N = 50) сообщили, что предсказания студентов правильны
приблизительно в 27% случаев. Д ля каждого описания, испытуемые оце­
нили эти девять областей согласно “вероятности того, что данный человек
является на данный момент аспирантом в этой области”. Они такж е опреде­
лили вероятность правильности первого выбора для каждого описания.
М анипуляция ожидаемой точностью имела существенное влияние на суж­
дения о вероятности. Средние оценки были 0.70 и 0.56, для группы с высокой
и с низкой точностью соответственно (t = 3.72, р < 0.001). Однако, распреде­
ление девяти исходов, полученных после инструкции о низкой точности, были
О психологии прогнозирования 71
незначительно ближе к распределению базового значения, чем распределе­
ние, полученное после инструкции о высокой точности. Для каждого испы­
туемого было вычислено произведение моментов между средней величиной,
которую он предписал каждому из этих девяти исходов (по этим пяти описа­
ниям) и базовым значением. С помощью этой корреляции можно измерить
степень, в которой прогнозы испытуемого соответствуют распределению ба­
зового значения. Среднее значение индивидуальных корреляций равнялось
0.13 для испытуемых в группе с высокой точностью и 0.1 б для испытуемых в
группе с низкой точностью. Эта разница не является значимой (t = 0.42, d f =
103). Данный пример суждения нарушает нормативную теорию прогнозиро­
вания, согласно которой любое уменьшение ожидаемой точности должно со­
провождаться изменением предсказаний в сторону базового значения.
Так к а к м анипуляция ожидаемой точностью не оказала влияния на про­
гнозы, две группы прогнозов были объединены. Последующие исследова­
ния были проведены тем ж е образом, что и в исследовании с Томом В. Для
каждого описания, было вычислено две корреляции: (а) между средней ве­
личиной вероятности и средней величиной подобия и (Ь) между средним
значением вероятности и средней величиной базового значения. Корреля­
ции отражены в Таблице 2, с учетом исхода, оцененного к а к наиболее веро­
ятный для каждого описания. Высокие значения корреляции были полу­
чены между прогнозом и подобием. И наоборот, не обнаружено системати­
ческой связи между базовым значением и прогнозом: значения корреляции
широко изменялись в зависимости от того, являю тся ли наиболее репрезен­
тативные исходы для каждого описания частыми или редкими.

Таблица 2. Корреляция средней величины вероятности со средним значе­


нием подобия и базовым значениям.

П ервое м одальное предсказание

Ю рис­ П рограм м и ­ М еди­ Библио­ Управ­


пруден­ рование цина т екарское ление
ция дело бизнесом
Со средним
значением 0.93 0.96 0.92 0.88 0.88
подобия
С базовым
значением 0.33 -0.35 0.27 -0.03 0.62

Как и в предыдущем случае, обсуждением базового значения здесь такж е


пренебрегли. В теории статистики, игнорировать базовое значение можно
72 РЕПРЕЗЕНТАТИВНОСТЬ
только в том случае, когда есть уверенность в безошибочности прогноза. Во
всех других случаях, должен быть найден соответствующий компромисс
между распределением, ожидаемым в соответствии с описанием, и распре­
делением базового значения. Маловероятно, что поверхностное описание че­
тырнадцатилетнего ребенка, основанное на единственном интервью, может
служ ить оправданием степени безошибочности, которую ожидали увидеть
испытуемые в прогнозах.
После пяти описаний личности, перед испытуемыми была поставлена
дополнительная задача:
О Доне известно только то, что он участвовал в первоначальном исследовании и сейчас
является аспирантом первого курса. Укажите вашу оценку, а также сообщите, насколь­
ко Вы уверены в правильности оценки этого случая.

Д ля Дона корреляция между средней величиной вероятности и оцененным


базовым значением равнялась 0.74. Таким образом, знание базового значе­
ния, которое не учитывалось при наличии описания, использовалось, ког­
да никакой дополнительной информации не было.

Д оказат ельст ва, основывающиеся на априорной вероятности либо


на информации об индивидууме
Следующее исследование представляет собой более тщательную проверку
гипотезы, что интуитивные предсказания зависят от репрезентативности и
относительно независимы от априорной вероятности. В этом исследовании
априорные вероятности были сформулированы так, чтобы сделать их более
выразительными и сопоставимыми со способом ответа. Испытуемым зачи­
тали следующий рассказ:
Группа психологов проинтервьюировала и провела личностный тест для
30 инженеров и 70 адвокатов, причем все они добились успеха в своих облас­
тях. На основе этой информации, были написаны краткие описания личнос­
ти 30 инженеров и 70 адвокатов. В ваших анкетах Вы найдете пять описаний,
выбранные наугад из 100 имеющихся в наличии описаний. Д ля каждого опи­
сания, пожалуйста, укажите вероятность (от 0 до 100) того, что описанный
человек является инженером.
Та ж е задача была выполнена группой экспертов, которые давали высо­
ко точны е оц ен ки вероятностей д л я р азли ч н ы х описаний. Вам будет
вы плачена премия, в зависимости от того насколько близкими Ваши оцен­
ки окаж утся к оценкам группы экспертов.
Инструкции были даны группе из 85 испытуемых (группа с малым коли­
чеством инженеров, или L группа). Испытуемые в другой группе (группа с
большим количеством инженеров, Н группа; N = 86) получили идентичные
инструкции, за исключением априорной вероятности: им указали, что из 100
изученных человек, 70 являются инженерами и 30 адвокатами. Испытуемым
обеих групп были выданы одни и те ж е описания. Вот одно из них:
О психологии прогнозирования 73
Джек - 45-летний мужчина. Женат, имеет четверых детей. В общем, консервативен,
осторожен и честолюбив. Не проявляет интереса к политическим и социальным про­
блемам, тратит большую часть свободного времени на свои многочисленные хобби, та­
кие как столярное дело, плавание и решение математических загадок.
Вероятность того, что Джек является одним из 30 инженеров в выборке из 100 человек
= _____ %.

После пяти описаний, испытуемые столкнулись с пустым описанием:


Предположим, что у Вас нет никакой информации относительно человека, выбранного
наугад из совокупности.
Вероятность того, что этот человек является одним из 30 инженеров в выборке из 100
человек =____ %

И в группе с большим количеством инженеров, и в группе с малым коли­


чеством инженеров половину испытуемых просили оценить, для каждого
описания, вероятность того, что описанный человек - инженер (как в при­
мере выш е), в то время как другие испытуемые оценивали для каждого опи­
сания вероятность того, что описанный человек - адвокат. Эта манипуля­
ция оказалась неэффективной. Средние вероятности, приписываемые ис­
ходам инженер и адвокат в двух различных формах, в сумме составляли
приблизительно 100% для каждого описания. Следовательно, данные для
обеих форм были объединены, и результаты представлены с точки зрения
исхода инженер.
Структура данного эксперимента позволяет вычислить подходящий об­
разец суждений. Вычисления основываются на формуле Байеса, в форме
вероятностей. Пусть О обозначает вероятность того, что отдельно взятое опи­
сание принадлежит скорее инженеру, чем адвокату. Согласно правилу Бай­
еса, О = Q х R, где Q обозначает априорную вероятность того, что наугад
выбранное описание принадлежит скорее инженеру, чем адвокату; и R -
отношение вероятности для отдельно взятого описания, то есть отношение
вероятности того, что человек, наугад выбранный из совокупности инж ене­
ров, будет описан к ак инженер, к вероятности того, что человек, отобран­
ный наугад из совокупности адвокатов, будет описан как адвокат.
Д ля группы с большим количеством инженеров, которой было сказано,
что выборка состоит из 70 инженеров и 30 адвокатов, априорное отношение
QHравно 70/30. Д ля группы с малым количеством инженеров QLравняется
30/70. Таким образом, для каждого описания, отношение апостериорной
вероятности для этих двух групп равно
74 РЕПРЕЗЕНТАТИВНОСТЬ

Рис. 1. Оцененная средняя вероятность (дня инженеров) для пяти описа­


ний и для “пустого” описания (квадратный символ) при высоких и низких
априорных вероятностях. (Изогнутая линия показывает правильное рас­
пределение согласно правилу Байеса.)

Так к а к соотношение вероятностей в этой формуле сокращается, то для всех


описаний должно быть получено одинаковое значение 0 H/ 0 L. Следователь­
но, в данном случае, правильный эффект манипуляции априорной вероят­
ности можно вычислить без знания соотношения вероятностей.
На Рисунке 1 можно увидеть средние оценки вероятности для каждого опи­
сания, к а к при высокой, так и при низкой априорной вероятности. Д ля к а ж ­
дого описания, средняя оценка вероятности, при высоком априорным соот­
ношении вероятностей (QH= 70/30) соответствует на графике средней оцен­
ке, при низкой априорной вероятности (QL= 30/70). Согласно нормативному
уравнению, полученному в предыдущем параграфе, все точки должны лежать
на кривой Байеса. В действительности, только пустой квадрат, который соот­
ветствует “пустым” описаниям, лежит на этой линии: при отсутствии описа­
ния, испытуемые решили, что оценка вероятности будет 70% при высокой
априорной вероятности и 30% при низкой априорной вероятности. В осталь­
ных ж е пяти случаях, точки лежат недалеко от линии идентификации.
Эффект априорной вероятности, хотя и небольшой, является статисти­
чески значимым. Д ля каждого испытуемого средняя оценка вероятности,
была вычислена для всех случаев, кроме случая с пустым описанием. Сред­
нее значение величин составило 50% для группы с низкой априорной веро­
ятностью и 55% для группы с высокой априорной вероятностью (t = 3.23,
df = 169, р < 0.01). Однако из Рисунка 1 следует, что каж дая точка леж ит
ближе к линии идентификации, чем к кривой Байеса. Следовательно, мож ­
О психологии прогнозирования 75
но сделать вывод о том, что м анипуляция априорным распределением ока­
зала минимальное влияние на субъективную вероятность. Как и в преды­
дущем эксперименте, испытуемые применили свои знания о априорной ве­
роятности только тогда, когда им не дали никакого подтверждения. Соглас­
но гипотезе репрезентативности, априорная вероятность не принималась во
внимание, когда информация об индивидууме была доступна.
Сила этого эффекта демонстрируется ответами на следующее описание:
Дик - 30-летний мужчина. Женат, еще не имеет детей. Очень способный и мотивиро­
ванный сотрудник, подает большие надежды. Пользуется признанием коллег.

Это описание было построено таким образом, чтобы быть полностью неин­
формативным в отношении профессии Дика. Испытуемые обеих групп при­
шли к согласию: средние оценки составили 50% (см. Рисунок 1). Разница
между ответами на это описание и на “пустое” описание разъясняет ситуа­
цию. Очевидно, люди реагируют по-разному, когда не получают никакого
описания, и когда дано бесполезное описание. В первом случае, априорная
вероятность принимается во внимание; во втором, априорная вероятность
игнорируется.3
Существуют ситуации, когда априорная вероятность, играет более суще­
ственную роль. Во всех примерах, рассмотренных до настоящего момента,
четко выраженные стереотипы были связаны с альтернативными исходами,
и, мы предполагаем, что суждения управлялись, степенью, в которой описа­
ния оказывались репрезентативными по отношению к этим стереотипам. В
других задачах исходы естественно рассматривать как части измерения. Пред­
положим, например, что Вас попросили оценить вероятность того, что к аж ­
дый из нескольких студентов получит стипендию. В этой задаче, не существует
хорошо обозначенных стереотипов студентов, которые получают или не по­
лучают стипендию. Скорее, естественно рассматривать исход (то есть, полу­
чение стипендии) как некий отрезок на прямой академических достижений
или способностей. Априорная вероятность, то есть процент стипендий в опре­
деленной группе, могла использоваться, чтобы устранить пределы. Следова­
тельно, они, вряд ли игнорируются. Кроме того, мы могли бы ожидать, что
экстремальные априорные вероятности будут оказывать некоторое воздей­
ствие даже при наличии четких стереотипов исходов. Точная схема условий,
при которых первичная информация используется или отвергается, требует
дальнейшего исследования.
Один из основных принципов статистического прогнозирования гласит,
что априорная вероятность, которая суммирует наши знания относительно
проблемы до того, к ак мы получили определенное описание, остается умест­
ной даже после того, как такое описание получено. Правило Байеса перево­
дит этот качественный принцип в мультипликативное соотношение между

3 ноем с. 185
76 РЕПРЕЗЕНТАТИВНОСТЬ
априорной вероятностью и отношением вероятности. Нашим испытуемым
не удалось объединить априорную вероятность и дополнительную информа­
цию. Когда им было предоставлено описание, каким бы неинформативным
или недостоверным оно ни было, Тома В. или Д ика (инженер/адвокат), ис­
пытуемые, очевидно, чувствовали, что распределение профессий в его груп­
пе больше не соответствовало действительности. Неспособность оценить роль
априорной вероятности, если дано определенное описание - это, возможно,
одно из наиболее существенных отклонений интуиции от нормативной тео­
рии прогнозирования.

Ч и словое прогн ози рован и е


Фундаментальное правило нормативной теории прогнозирования гласит,
что изменчивость предсказаний на основании ряда случаев, должна отра­
ж ать точность прогноза. Когда точность прогноза совершенна, человек пред­
сказывает то значение критерия, которое фактически будет получено. Ког­
да неопределенность максимальна, во всех случаях прогнозируется фикси­
рованное значение величины. (При прогнозировании категории, предска­
зывается наиболее частая категория. При числовом прогнозировании пред­
сказывается среднее значение, мода, медиана или некоторая другая вели­
чина в зависимости от функции потерь.) Таким образом, изменчивость про­
гнозов равна изменчивости критерия, когда точность прогноза совершен­
на, и изменчивость прогноза равна нулю, когда точность прогноза нулевая.
П ри средней точности прогноза, изменчивость прогноза принимает проме­
жуточное значение, то есть прогнозы регрессивны относительно критерия.
Таким образом, чем больше неопределенность, тем меньше изменчивость
прогнозов. Прогнозы, сделанные на основании репрезентативности, не сле­
дуют этому правилу. В предыдущей главе мы продемонстрировали, что люди
не делали регресс в сторону более частых категорий при уменьшении ож и­
даемой точности предсказаний. Эта глава демонстрирует аналогичную не­
способность в контексте числового прогнозирования.

Прогнозирование исходов либо оценка исходных данны х


Предположим, Вам сообщают, что консультант-психолог описал студента
первого курса к а к умного, уверенного в себе, начитанного, трудолюбивого
и любознательного. Рассмотрим два типа вопросов, которые можно было бы
задать по этому описанию:
(А) Оценка : Какое мнение складывается у Вас относительно способностей к учебе после
этого описания? Какой процент описаний первокурсников, по Вашему мнению, произ­
вел бы на Вас большее впечатление? (Б) Прогнозирование: Как Вы думаете, какие сред­
ние оценки получит этот студент? Какой процент первокурсников получит более высо­
кую среднюю оценку?
О психологии прогнозирования 77
Между этими двумя вопросами имеется важное различие. В первом слу­
чае Вы оцениваете исходные данные; а во втором, Вы прогнозируете исход.
Так как во втором вопросе существует большая неопределенность, чем в
йервом, ваше прогнозирование должно быть более регрессивным, чем ваша
оценка. То есть процент, который Вы даете в качестве прогноза, должен быть
ближе к 50% , чем тот процент, который Вы даете в качестве оценки. Чтобы
подчеркнуть различие между этими вопросами, предположим, что описа­
ние является неточным. Это н икак не должно повлиять на вашу оценку:
оценка описаний относительно того, какое они производят впечатление, не
зависит от их точности. С другой стороны, в прогнозировании вы должны
быть регрессивны настолько, чтобы, предположить, что описание неточно
или ваше прогнозирование недостоверно.
Как бы там ни было, гипотеза репрезентативности гласит, что прогнози­
рование и оценка должны совпадать. Оценивая данное описание, люди вы­
бирают число, которое является наиболее репрезентативным по отношению
к описанию. Если люди предсказывают на основе репрезентативности, то в
качестве прогноза они такж е выберут самое репрезентативное число. Сле­
довательно, оценка и прогнозирование - это, по сути, одно и то же. Чтобы
проверить эту гипотезу, было проведено несколько исследований. В к а ж ­
дом из этих исследований испытуемым давали описательную информацию
касательно некоего набора случаев. Группа оценки определяла качество
каждого описания относительно данной совокупности, а группа прогнози­
рования предсказывала будущее развитие событий. Суждения этих двух
групп сравнивались, чтобы проверить, являю тся ли прогнозы более регрес­
сивными, чем оценки.
В двух исследованиях испытуемым предложили описания студентов-
первокурсников, составленные на основе интервью при поступлении. В пер­
вом исследовании каждое описание состояло из пяти прилагательных, опи­
сывающих интеллектуальные способности и черты характера, к ак в приве­
денном примере. Во втором исследовании описания представляли собой тек­
сты длиной примерно в абзац, в которых описывались детали биографии
студентов, и то, к ак они адаптировались в колледже на настоящий момент.
В обоих исследованиях группу оценки попросили рассмотреть каждое из
описаний, определив “процент студентов во всем классе, чьи описания сви­
детельствуют о больших способностях”. Группе прогнозирования дали те
же самые описания и попросили сделать прогноз относительно того, какую
среднюю годовую оценку получит этот студент и его класс по окончанию
учебного года в процентилях.
Результаты обоих исследований отражены на Рисунке 2, который пока­
зывает для каждого описания среднее значение прогноза среднегодовой ус­
певаемости в процентилях по отношению к средней оценке. Единственное
систематическое различие между прогнозами и оценками наблюдалось в ис­
следовании с прилагательны ми, когда предсказания были значительно
78 РЕПРЕЗЕНТАТИВНОСТЬ
выше, чем соответствующие оценки. Стандартное отклонение предсказа­
ний или оценок было подсчитано, опираясь на данные каждого испытуемо­
го. Сравнение этих величин не дало значительной разницы изменчивости
между группами оценки и прогнозирования в пределах значений исследуе­
мых величин. В исследовании с прилагательными средняя величина стан­
дартного отклонения составила 25.7 для группы оценки (N = 38) и 24.0 для
группы прогнозирования (N = 36, t = 1.25, d f = 72, не значимо). При иссле­
довании описаний средняя величина стандартного отклонения составила
22.2 для группы оценки (N=37) и 21.4 для группы прогнозирования (N = 63,
t = 0 .7 5 , d f = 9 8 , не значимо). В двух исследованиях и группа оценки, и груп­
па прогнозирования производили одинаково экстремальные суждения, хотя
первая группа предсказывала отдаленный объективный критерий на осно­
ве поверхностной информации, полученной из интервью; в то время к ак вто­
рая группа оценивала впечатление, которое н а нее произвело каждое описа­
ние. В статистической теории прогнозирования наблюдаемое равенство меж ­
ду оценками и прогнозами было бы возможно, если точность прогноза со­
вершенна, а в целом, это условие не соблюдалось в исследовании.

Оценка Оценка

Рисунок 2. Предсказанная процентильная среднегодовая успевае­


мость к а к ф ункция процентильной оценки для исследований с ис­
пользованием прилагательных и сообщений.

Еще одно свидетельство равенства оценки и прогноза было получено Бейт


(Beyth) в ее докторской диссертации. Она дала трем группам испытуемых
семь абзацев текста, каждый их которых описывал поведение студента-прак-
тиканта на одном из уроков во время практики. В качестве испытуемых были
привлечены изучающ ие статистику студенты университета Hebrew. Им
сказали, что описания были получены из картотеки 100 преподавателей н а­
О психологии прогнозирования 79
чальной ш колы , которые, пятью годами ранее, окончили курс обучения.
Испытуемых в группе оценки попросили оценить качество урока, описан­
ного в тексте, длинной в абзац, в процентилях относительно данной сово­
купности. Испытуемых в группе прогнозирования попросили сделать про­
гноз (в процентилях) настоящего положения каждого преподавателя, то есть
его полную компетентность через 5 лет после составления описания. И груп­
па оценки, и группа прогнозирования выполнили обе задачи. К ак и в иссле­
дованиях, описанных выше, разница между оценкой и прогнозом была не­
существенной. Этот результат оставался тем ж е и при сравнении между ис­
пытуемыми в группе, и при сравнении испытуемым собственных результа­
тов. Х отя испытуемые знали, какая пропасть отделяет один пробный урок
и время получения пятилетнего опыта работы, это знание не привело к тому,
что их прогнозы стали более регрессивными, чем их оценки.

П рогнозирование или т рансляция


Предыдущие исследования показали, что прогнозирования переменной не
регрессивны при сравнении с оценками исходных данных в терминах этой
переменной. В следующем исследовании мы покажем, что существуют си­
туации, в которых прогнозирования значения переменной (успеваемости)
не более регрессивны, чем простая трансляция этой переменной из одного
масштаба в другой. В качестве результирующей переменной была выбрана
среднегодовая оценка, потому что ее корреляции и свойства ее распределе­
ния хорошо известны испытуемым.
В эксперименте участвовали три группы испытуемых. Испытуемые во
всех группах прогнозировали среднегодовую оценку 10 гипотетических сту­
дентов на основании только процентильной оценки, полученной каж дым
из этих студентов. Один и тот же набор процентильных оценок был пред­
ставлен всем группам, но эти три группы получили различные интерпрета­
ции исходной переменной следующим образом:
1. Процентиль среднегодовой оценки. Испытуемым в Группе 1 (N = 32)
сказали, что “для каждого из нескольких студентов вам предложат процен-
тильную оценку, представляющую его успеваемость в течение первого года
обучения, и Вас просят угадать его среднегодовую оценку в этом году”. Ис­
пытуемым объяснили, что “65 баллов, например, означает, что среднегодо­
вая оценка, полученная этим студентом лучше, чем у 65% студентов его
группы, и т.д. ”.
2. Умственная концентрация. Испытуемым Группы 2 (N = 37) сообщили,
что “тест на умственную концентрацию измеряет способность концентрироваться
и извлекать всю информацию из сложных сообщений. Было обнаружено, что
студенты с высокими среднегодовыми оценками склонны успешно проходить
тесты на умственную концентрацию и наоборот. Однако выяснилось, что резуль­
таты теста на умственную концентрацию зависят от настроения и психического
80 РЕПРЕЗЕНТАТИВНОСТЬ
состояния человека во время прохождения теста. Таким образом, один и тот же
человек может получить различные результаты при многократном тестировании,
в зависимости от того, хорошо ли он выспался предыдущей ночью или от само­
чувствия в этот день.3

Рис. 3. Предсказания среднегодовой оценки в зависимости от про-


центильных оценок для трех переменных

3. Чувство юмора. Испытуемым в Группе 3 (N = 35) сообщили, что “тести­


рование чувства юмора измеряет способность людей придумывать остроумные
надписи для комиксов и оценивать проявления юмора в различных формах. Было
обнаружено, что студенты, показывающие высокие результаты при прохожде­
нии этого теста, как правило, получают более высокие среднегодовые оценки,
чем студенты, которые показывают в этом тесте плохие результаты. Однако, не­
возможно предсказать среднегодовые оценки с высокой точностью, основыва­
ясь на чувстве юмора.”
В настоящем исследовании, все испытуемые прогнозировали среднегодовые
оценки на основе одних и тех же процентильных оценок. Группа 1 просто пере­
вела значения среднегодовой успеваемости в процентиле на шкалу среднегодо­
вых оценок. С другой стороны, Группы 2 и 3 предсказывали среднегодовую оценку
на базе более отдаленных исходных данных. Исходя из соображений норматив­
ной теории, прогнозы этих групп должны быть более регрессивными, то есть
менее изменчивыми, чем суждения Группы 1. Однако гипотеза репрезентатив­
ности предполагает другие результаты.
Группа 2 делала прогнозы на основе потенциально верного, но ненадежного
теста на умственную концентрацию, который был представлен как мера успева-
О психологии прогнозирования 81
емости. Мы выдвинули гипотезу, что предсказания этой группы были бы менее
регрессивными при их сравнении с предсказаниями Группы 1. В общем, мы пред­
полагаем, что балл успеваемости (например, среднегодовая оценка), который
лучше всего представляет значение в процентиле, измеряя способности (напри­
мер, умственную концентрацию), это тот, который соответствует тому же само­
му процентилю на шкале успеваемости.

Таблица 3. Средняя величина значения индивидуальных прогнозов для трех


групп и результаты запланированного сравнения между группами 1 и 2, и
между группами 2 и 3

Г руппа
1. 1и 2 2. 2 и3 3.
Среднегодо­ Умст вен­ Чувство
Статистика вая оценка ная ю мора
в процен­ концент ра­
тиле ция
Средняя
спрогнозиро­
Не 2.46
ванная 2.27 значимо 2.35 0.05
среднегодо­
вая оценка
Ст андарт ное
0.91 Не 0.01 0.69
отклонение 0.87
прогнозов значимо
Отклонение
0.030 Не 0.029 0.01 0.022
регрессии значимо
Не Не 0.94
Корреляция г 0.97 0.95 значимо
значимо

Так как ненадежность данных не влияет на репрезентативность, мы предпо­


лагаем, что прогнозы среднегодовой оценки на базе ненадежного теста на ум­
ственную концентрацию будут по существу идентичными предсказаниям сред­
негодовой оценки на базе среднегодовой оценки в процентиле. С другой сторо­
ны. ожидалось, что предсказания Группы 3 будут регрессивными, потому что
чувство юмора обычно не рассматривается как мера успеваемости.
Средние прогнозы, приходящиеся на 10 баллов в процентиле по трем груп­
пам, показаны на Рисунке 3. Исходя из Рисунка 3, можно сказать, что про­
гнозы Группы 2 не более регрессивны, чем прогнозы Группы 1, в то время
как прогнозы Группы 3 оказываются более регрессивными.
В пределах данных каждого отдельного испытуемого были вычислены 4
индекса: средняя величина его прогноза, стандартное отклонение его про­
гноза, отклонение регрессии спрогнозированной среднегодовой оценки на
82 РЕПРЕЗЕНТАТИВНОСТЬ
исходном множестве, и корреляция между ними. Средние величины трех
значений для этих трех групп показаны в Таблице 3.
Из таблицы видно, что испытуемые во всех трех группах привели пра­
вильные данные, что проявляется в высоких корреляциях между исходны­
ми данными и прогнозами (средние корреляции были получены за счет пре­
образования индивидуальных значений в z-значения Фишера). Результа­
ты запланированных сравнений между Группами 1 и 2 и между Группами 2
и 3 подтверждают принцип, наблюдаемый на Рисунке 3. Нет существен­
ных различий между прогнозами, сделанными на базе среднегодовой оцен­
ки в процентиле, и прогнозами, сделанными на основе теста на умственную
концентрацию. Таким образом, люди не производили регресс при предска­
зании меры успеваемости на базе данных об уровне способностей, даж е и
ненадежных.
Предсказания, основанные на данных о чувстве юмора, с другой сторо­
ны , являю тся регрессивными, хотя и недостаточно. Отношение между сред­
негодовой оценкой и чувством юмора, выведенное из сравнения линий рег­
рессии приблизительно 0.70. К тому ж е, прогнозы, основанные на данных о
чувстве юмора значительно выше, чем прогнозы, основанные на данных об
умственной концентрации. Кроме того, у прогнозов на основании данных
об умственной концентрации существует тенденция превышать прогнозы,
основанные на среднегодовой оценке в процентиле. Мы наблюдали это яв ­
ление во многих исследованиях. Прогнозируя успеваемость человека на
основе несовершенной информации, испытуемые проявляют снисходитель­
ность (Guilford, 1954). Вслед за уменьшением надежности, они все больше
опираются на спрогнозированный уровень поведения.
К ак ожидается, прогнозы будут по существу нерегрессивными, когда
исходные переменные, а такж е переменные исхода рассматриваются как
проявления той ж е самой черты. Пример таких прогнозов можно найти и в
реальных условиях, например, Коллегия по отбору офицеров в израильс­
кой армии. Опытные офицеры, входящие в состав экзаменационной комис­
сии, обычно оценивают кандидатов по семибальной ш кале по окончанию
нескольких дней экзаменов и наблюдений. В исследовательских целях для
каж дого прошедшего испы тания кандидата им нуж но было предсказать
заклю чительный ранг, который он получит в офицерской школе. Из более
чем 200 случаев обнаружилось, что предсказанное распределение рангов
было практически идентичным фактическому распределению, с одним оче­
видным исключением: прогнозы неудач были менее часты, чем фактичес­
кие неудачи. К ак правило, частоты прогнозов в двух самых высоких кате­
гориях точно соответствовали фактическим частотам. Все испытуемые пре­
красно знали, что исследование указывает на то, что надежность их прогно­
зов была только умеренной (от 0.20 до 0.40). Однако их предсказания были
нерегрессивными.
О психологии прогнозирования 83
М ето д о л о ги ч еск и е с о о б р а ж е н и я
Гипотеза репрезентативности гласит, что прогнозы не отличаются от оце­
нок подобия, хотя нормативная теория статистики подразумевает то, что
прогнозы должны быть менее экстремальными, чем оценки. Поэтому тес­
тирование гипотезы репрезентативности требует исследования, в котором
прогнозы сравниваются с другим типом суждений. Варианты двух сравни­
тельных анализов использовались в исследованиях, о которых говорится в
этой части книги.
В одном исследовании, обозначенном A-XY, различные группы испыту­
емых оценивали две переменные (X и Y) на основе одной и той ж е исходной
информации (А). В случае Тома В., например, двум различным группам
давали одну и ту ж е исходную информацию (А), то есть описание личности.
Одна группа оценивала исходы с точки зрения подобия (X), в то время к ак
другая оценивала исходы с точки зрения вероятности (Y). Точно так ж е в
нескольких исследованиях, посвященных прогнозированию числа, различ­
ным группам давали одну и ту ж е информацию (А), например, список пяти
прилагательных, описывающих студента. Одна группа проводила оцени­
вание (X), а другая — прогнозирование (Y).
В другом исследовании, обозначенном АВ-Х, две различных группы ис­
пытуемых оценивали одну и ту ж е переменную результата (X) на основе
различной исходной информации (А и В). В исследовании “инженер/адво-
кат”, например, две различных группы проводили одну и ту ж е оценку (X)
вероятности того, что отдельно взяты й человек является инженером. Им
предоставили краткое описание его личности и различную информацию (А
и В) относительно частот базового значения инженеров и адвокатов. В кон­
тексте прогнозирования числа, различные группы прогнозировали средне­
годовую оценку (X) на основе различных переменных - процентная средне­
годовой оценки (А) и умственной концентрации (В).
Гипотеза репрезентативности была подтверждена при сравнительном
анализе, который показал, что в отличие от нормативной модели, прогнозы
не более регрессивны, чем оценки или суждения подобия. Такж е возможно
выяснить, являю тся ли интуитивные прогнозы регрессивными по сравне­
нию с фактическими исходами, или с исходными данными, когда входные
данные и исходы измеряются по одной и той ж е шкале. Даже, в том случае,
когда предсказания не более регрессивны, чем трансляции, мы ожидаем,
что они будут слегка регрессивными по сравнению с исходами из-за извест­
ной ошибки тяготеть к центральной тенденции (Jonson, 1972; W oodworth,
1938). В большом разнообразии оценочных задач, вклю чая простую транс­
ляцию исходных данных с одной ш калы на другую, испытуемые имеют тен­
денцию избегать крайних ответов и уменьшать изменчивость своих сужде­
ний (Stevens и Greenbaum, 1966). Из-за этого предубеждения, суждения бу­
дут регрессивны по сравнению с входными данными или с исходами. Ис­
84 РЕПРЕЗЕНТАТИВНОСТЬ
следования, используемые в этой книге, нейтрализуют это влияние, срав­
нивая две оценки, подверженные одному и тому ж е предубеждению.
Настоящая серия исследований была посвящена ситуациям, в которых
люди делают прогнозы на основе информации, которая доступна им до про­
ведения исследования, в форме стереотипов (например, инженера) и ожида­
ний относительно отношений между переменными. Обратная связь исхода
не обеспечивалась, и количество оценок, которые должен был осуществить
каж ды й тестируемый, было мало. Напротив, самые ранние исследования
прогнозирования касались изучения функциональных или статистических
отношений между переменными, с которыми испытуемые не имели никако­
го предшествующего знакомства. Эти исследования обычно стимулируют
большое количество попыток и различны х форм обратной связи исхода.
(Часть этой литературы была рассмотрена в работах Словика и Лихтенштей­
на, 1971.) В исследовании повторных прогнозов с обратной связью, испытуе­
мые вообще предсказывают, выбирая результаты так, чтобы полная после­
довательность или образец предсказаний были высоко репрезентативными
по отношению к распределению исходов. Например, испытуемые в исследо­
ваниях, изучающих вероятность, производят последовательности прогнозов,
которые едва соответствуют статистическим характеристикам последователь­
ности исходов. Точно так ж е испытуемые в задачах числового прогнозирова­
ния приблизительно воспроизводят график рассеивания, то есть объединен­
ное распределение входных данных и исходов (см., например Grey, 1968). Для
того чтобы это сделать, испытуемые прибегают к смешанной стратегии: для
любых исходных данных они производят распределение различных предска­
заний. Эти прогнозы отражают то, что любой набор исходных данных вы зы ­
вает различные исходы при различных испытаниях. Очевидно, правила про­
гнозирования различны в этих двух парадигмах, хотя репрезентативность
имеет отношение к обеим. В парадигме обратной связи испытуемые произво­
дят последовательности ответов, представляющие целостные модели связи
между исходными данными и исходами. В ситуациях, исследуемых в этой
книге, испытуемые выбирают прогноз, который лучше всего представляет
их впечатления относительно каждого отдельного случая. Эти два подхода
ведут к различным нарушениям нормативного правила: представление нео­
пределенности с помощью смешанной стратегии в парадигме обратной связи
и уменьшение неуверенности за счет прогнозирования с помощью оценок в
данной парадигме.

Д остоверн ость и и лл ю зи я валидности


К ак демонстрируется в предшествующих разделах книги, люди прогнози­
руют, вы бирая исход, который является наиболее репрезентативным по
отношению к исходным данным. Мы предполагаем, что степень достовер­
ности, которую человек предполагает в предсказании, отражает степень, в
которой выбранный исход является более репрезентативным по отношению
О психологии прогнозирования 85
к исходным данным, чем другие исходы. Главный показатель репрезента­
тивности в контексте предсказания чисел с мультиатрибутивными исход­
ными данными (например, оценки профилей) — это упорядоченность или
взаимосвязанность исходных данных. Чем более упорядочены исходные
данные, тем более репрезентативной будет казаться предсказанная величи­
на и тем большей будет достоверность этого прогноза. Например, люди про­
гнозируют среднее значение В с большей достоверностью на основе оценок
В в двух разных предварительных испытаниях, чем на основе А и С. Дей­
ствительно, было обнаружено, что внутренняя изменчивость или несогла­
сованность исходных данных уменьшает достоверность прогнозов (Slovic,
1966).
Невозможно преодолеть заблуждение, для которого упорядоченные про­
фили позволяют большую прогнозируемость, чем неупорядоченные. Стоит
отметить, однако, что это убеждение несовместимо с обычно применяемой
многовариантной моделью прогнозирования (то есть, нормальной линейной
моделью), в которой ожидаемая точность прогноза не зависит от изменчи­
вости в пределах профиля.
С упорядоченными профилями испытуемые обычно сталкиваются, ког­
да прогнозируют на основании высоко коррелированного множества. Не­
упорядоченные профили, наоборот, являю тся более частыми при низких
корреляциях. Поскольку достоверность растет с увеличением упорядочен­
ности, достоверность будет высокой, когда исходные переменные высоко
коррелированы. К ак бы там ни было, если даны исходные переменные за­
данной валидности, многократная корреляция с критерием обратно пропор­
ционально связана с корреляциями между исходными данными. Таким об­
разом, возникает парадоксальная ситуация, при которой высокие взаимо­
связи между исходными данными увеличивают надежность и уменьшают
достоверность.
Чтобы продемонстрировать этот эффект, мы попросили испытуемых сде­
лать прогноз среднегодовой оценки на основе двух пар тестов на способнос­
ти. Испытуемым сказали, что одна пара тестов (творческое мышление и спо­
собность к символизации) была высоко коррелированной, в то время к ак
другая пара тестов (гибкость ума и систематичность рассуждения) не была
коррелированной. Множество, с которым они столкнулись, оправдало эти
ожидания. (Для половины испытуемых ярлы ки коррелированные и некор­
релированные для пары тестов были изменены на противоположные). Ис­
пытуемым сообщили, что “все тесты были одинаково действенными в про­
гнозировании успеваемости в колледж е”. Конечно, в этой ситуации, более
высокая точность прогнозов может быть достигнута с некоррелированной
парой тестов, чем с коррелированной парой. Но, к ак и ожидалось, испыту­
емые были более уверены в прогнозах на базе коррелированных испытаний,
для полного диапазона м нож ества прогнозирования (t = 4.80, d f = 129,
р < 0.001). То есть, они были более уверены в контексте с более низкой про­
гнозирующей валидностью.
86 РЕПРЕЗЕНТАТИВНОСТЬ
Другой вывод, который может быть получен из исследований прогнози­
рования, вклю чая и наш е - это то, что достоверность представляет собой
функцию спрогнозированного уровня действия, график которой по форме
напоминает букву J (см. Johnson, 1972). Испытуемые прогнозируют высо­
кую успеваемость с большой степенью достоверности, и они проявляют боль­
шую степень достоверности, прогнозируя полную неудачу, чем среднюю ус­
певаемость. К ак мы видели ранее, интуитивные предсказания часто недо­
статочно регрессивны. Поэтому несоответствия между прогнозами и исхо­
дами, являю тся самыми большими в экстремумах. J -образная ф ункция
достоверности подразумевает, что испытуемые наиболее уверены в предска­
заниях, которые, скорее всего, ложны.
Предшествующий анализ показывает, что факторы, которые увеличи­
вают достоверность, например, упорядоченность и экстремальность, часто
отрицательно коррелированны с точностью прогнозов. Таким образом, люди
склонны быть слиш ком уверенными в ошибочных суждениях, явление, ко­
торое можно назвать иллюзией валидности . Подобно прочим ошибкам вос­
п риятия и суждения, иллю зия валидности часто сохраняется даж е тогда,
когда признан ее иллюзорный характер. Интервьюируя кандидата, напри­
мер, многие из нас испытывают большую уверенность по поводу прогноза
его будущей деятельности, несмотря на знание о том, что интервью часто
бывают ошибочными.

П редстав л ен и я относительно регресса


Последствия регресса окружают нас повсюду. В ж изни у самых выдающихся
отцов бывают посредственные сыновья, у замечательных ж ен заурядные
муж ья, неадаптированные имеют тенденцию приспосабливаться, а от счаст­
ливчиков, в конечном счете, удача отворачивается. Несмотря на эти факто­
ры , люди не приобретают надлежащ ее понятие регресса. Во-первых, они не
ожидают проявления регресса во многих ситуациях, где он должен произой­
ти. Во-вторых, что подтвердит любой преподаватель статистики, чрезвы­
чайно трудно приобрести надлежащ ее понятие регресса. В-третьих, когда
люди наблюдают регресс, они обычно изобретают для этого явления лож ­
ные динамические объяснения.
Что ж е делает понятие регресса противоречащим интуиции, который
трудно приобрести и применить? Мы утверждаем, что главный источник
трудностей - то, что эффекты регресса обычно нарушают интуицию, кото­
рая говорит нам, что спрогнозированный исход должен быть максимально
репрезентативен по отношению к исходной информации.4

4 Ожидание того, что каждый значимый акт поведения высоко репрезентативен по отноше­
нию к исполнителю, может объяснить, почему как обыватели, так и психологи постоянно
удивляются незначительным корреляциям среди, как кажется, взаимозаменяемых изме­
рений честности, рискованности, агрессии и зависимости (Mischei, 1968).
О психологии прогнозирования 87
Чтобы проиллюстрировать постоянство нерегрессивной интуиции, не­
смотря на то, что она подчиняется статистике, мы представили следующую
проблему нашей выборке аспирантов, специализирующихся в психологии:
Проблема тестирования. Человек, выбранный наугад, обладает коэффициентом интел­
лекта, равным 140. Предположим, что коэффициент интеллекта представляет собой
сумму “истинного” количества очков и случайную ошибку измерения.

Пожалуйста, назовите верхние и нижние пределы достоверности 95% для истинного


коэффициента интеллекта этого человека. То есть назовите такой верхний предел, при
котором Вы уверенны на 95%, что истинный коэффициент интеллекта, фактически,
ниже, чем эта цифра, и такой низший предел, что Вы уверенны на 95%, что истинный
коэффициент интеллекта фактически выше.

В этой задаче, испытуемых попросили считать наблюдаемый коэффици­


ент интеллекта суммой “истинного” показателя интеллекта и компонента
ошибки. Так к а к наблюдаемый уровень интеллекта значительно выше сред­
него, более вероятно, что компонент ошибки положителен и что этот чело­
век на последующих тестах получит более низкий результат. Большинство
испытуемых (73 из 108), однако, установили интервалы достоверности сим­
метрично относительно 140, не показав никакого ож идания регресса. Из
оставшихся 35 испытуемых, 24 задали интервалы регрессивной достовер­
ности, a l l задали контррегрессивные интервалы. Таким образом, большин­
ство испытуемых проигнорировало влияние ненадежности исходных дан­
ных и прогнозировало так, к ак будто величина 140 была истинным показа­
телем интеллекта. В этой части книги неоднократно обращается внимание
на тенденцию предсказывать безошибочность исходной информации.
Возникновение регресса такж е иногда признается, либо потому что мы
обнаруживаем эффект регресса в наш их собственных наблюдениях, либо
потому что нам явно говорят, что регресс произошел. Когда эффект регрес­
са обнаружен, он обычно рассматривается к а к систематическое изменение,
которое требует независимого объяснения. Действительно, в социальных
науках предлагалось много ложных объяснений эффектов регресса5. Исполь­
зовались динамические принципы, чтобы объяснить, почему бизнес, одно
время очень успешный, имеет тенденцию к ухудшению впоследствии, и
почему обучение интерпретации выражений лица полезно для тех учащ их­
ся, которые показали плохие результаты на предварительных экзаменах, и
вредно для тех, кто показал самые хорошие результаты. Некоторые из этих
объяснений не были бы предложены, если бы их авторы поняли, что если
даны две переменные равной изменчивости, следующие два утверждения
логически эквивалентны: (a) Y регрессивен относительно X; (б) корреляция

5Для освещения обсуждений ошибок в исследованиях, связанных с регрессом, см., напри­


мер, Campbell (1969) и Wallis и Roberts (1956).
между Y и X - меньше единицы. Поэтому объяснение регресса является
равносильным объяснению того, почему корреляция меньше единицы.
В качестве заключительной иллюстрации того, насколько трудно распоз­
нать и должным образом интерпретировать регресс, рассмотрим следующий
вопрос, который был задан нашей выборке аспирантов. Описанная задача
фактически возникла в опыте одного из авторов.
Задача обучения. Инструкторы в летной школе использовали политику последователь­
ного положительного поощрения, рекомендуемую психологами. Они устно поощряли
каждое успешное выполнение маневра в полете. После некоторого времени примене­
ния этого подхода обучения, инструкторы заявили, чтобы вопреки психологической
доктрине, высокая похвала за хорошее выполнение сложных маневров, обычно приво­
дит к ухудшению их выполнения при следующей попытке. Что должен ответить пси­
холог?

Регресс неизбежен в летных маневрах, потому что его выполнение не яв л я­


ется абсолютно надежным, и прогресс при их последовательном выполне­
нии идет медленно. Следовательно, пилоты, которые исключительно успеш­
но проявили себя на одном испытании, вероятно, проявят себя хуж е на сле­
дующем, независимо от реакции инструкторов на их изначальный успех.
Опытные инструкторы летной ш колы фактически обнаружили регресс, но
приписали это вредному влиянию поощрения. Эта история из ж изни иллю­
стрирует печальный аспект человеческого положения. Мы обычно хвалим
других, когда они хорошо себя ведут, и наказываем их, когда они ведут себя
плохо. Только благодаря регрессу, они будут показывать хорошие резуль­
таты после наказания и плохие после похвалы. Следовательно, перед нами
ж изненная схема, согласно которой нас часто хвалят за то, что мы наказы ­
ваем других, и наоборот.
Н и один из аспирантов, отвечавших на этот вопрос, не предположил, что
регресс мог быть причиной проблемы. Вместо этого, они предложили, что
устное поощрение могло быть неэффективным для пилотов, или что оно
могло привести к самонадеянности. Некоторые аспиранты даже сомнева­
лись относительно валидности впечатлений инструкторов и обсуждали воз­
можные источники предубеждения в их восприятии ситуации. Эти респон­
денты несомненно были полностью ознакомлены с понятием статистичес­
кого регресса. Однако они не сумели распознать случай регресса, когда он
не был изложен в знакомых терминах роста отцов и сыновей. Очевидно, одно
лиш ь обучение статистике не меняет фундаментальную интуицию в вопро­
сах неопределенности.
5. Изучение репрезентативности

Майя Бар-Хиллер

Даниель Канеман и Амос Тверски предположили, что при оценке вероятно­


сти неопределенных событий люди часто обращаются к эвристике или к эм­
пирическим правилам, которые почти не коррелируют (если коррелируют
вообще) с переменными, которые фактически определяют вероятность со­
бытия. Одна из таких эвристик — репрезентативность, определяемая как
субъективная оценка степени, в которой рассматриваемое событие “явл я­
ется в существенных свойствах подобным своей исходной совокупности” или
“ отраж ает существенные особенности процесса, который его породил”
(Kahneman & Tversky, 1972b, с. 431, 3). Хотя в некоторых случаях более
вероятные события оказываются такж е более репрезентативными (и наобо­
рот), уверенность относительно репрезентативности случая к ак показателя
его вероятности может привести к двум видам систематических ошибок в
суждении. Во-первых, это может придать чрезмерный вес переменным, ко­
торые влияют на репрезентативность события, а не на его вероятность. Во-
вторых, это может уменьшать важность переменных, крайне необходимых
для определения вероятности события, но не связанных с его репрезента­
тивностью.
К онцепция репрезентативности иногда критиковалась к а к слиш ком
неопределенная и неуловимая, возможно, потому что в ней не хватает об­
щего определения. Однако мы не утверждаем, что невозможно оценить реп­
резентативность независимо от оценки вероятности, — заключение, кото­
рое^часто подразумевалось критиками. Например, в исследовании “ТомаВ.”,
Канеман и Тверски (1973, 4) определяли репрезентативность как подобие
некоторого человека, Тома В., “типичному аспиранту в ... (нескольких) об­
ластях специализации” (1973, с. 238) и оценивали ее независимо от вероят­
ности того, что Том В. действительно занимался этими областями науки. В
других исследованиях, независимая оценка на основе репрезентативности
не применялась только потому, что читатели могли без труда провести ее
самостоятельно с помощью мысленного эксперимента.
90 РЕПРЕЗЕНТАТИВНОСТЬ

L М R

Рис. 1. Характерный стимул, использованный при изучении подобия


и вероятности
(.Источник : Бар-Хиллер, 1974).

П одоби е и в е р о я т н о с т ь
Вскоре после того, к ак было введено понятие репрезентативности, я прове­
ла небольшое исследование, в котором репрезентативность оценивалась, как
в соответствии с априорными критериями (что будет разъяснено позже в
этой главе), так и экспериментально, в соответствии с оценками испытуе­
мых. Затем я сравнила эти оценки с независимо собранными суждениями о
вероятности (Bar-Hillel, 1974). Преимуществом изучаемых задач являлась
их уникальность, четко определенная вероятность, а такж е простота визу­
ального представления, позволяющая легко делать суждения о видимом по­
добии.
В качестве стимулов в этом исследовании были выбраны тройки гистог­
рамм, обозначенные L, М и R для левой, средней и правой гистограммы,
соответственно. Пример приведен на Рисунке 1. К аж дая диаграмма состо­
ит из трех полос, которые окрашены, слева направо, в зеленый, ж елты й и
красны й цвет. В длину каж дая полоса поделена на 5 частей, а длины этих
трех полос в пределах каждой гистограммы, в сумме составляют 100.
Все тройки гистограмм (L, М, R), используемые в этом эксперименте об­
ладали следующими свойствами:
1. Каждая полоса в средней гистограмме является средней по длине между
соответствующими полосами в гистограммах слева и справа (однако если,
средняя длина левой и правой полос не достигала числа, кратного пяти, сред­
н яя полоса округлялась к ближайшему числу, кратному пяти.) Например,
на Рисунке 1, длина зеленой полосы в М-гистограмме = 35, что находится
между 20 и 50 (соответствующие длины полос в L и R гистограммах). То ж е
можно сказать про ж елтые и красные полосы. (Обратите внимание, однако,
что длины этих полос округлены: от 42.5 до 40 и от 22.5 до 25.)
Изучение репрезентативности 91
2. Порядок длин полос в М-гистограмме совпадает с порядком или в L-
или в R -гистограмме, но не с двумя, так к ак L- и R -гистограмма всегда упо­
рядочены по-разному. Например, на Рисунке 1 порядок М и L один и тот
же, причем красная полоса - самая короткая, а ж елтая - самая высокая в
обеих диаграммах, что отличается от порядка в R диаграмме, где ж елтая по­
лоса самая короткая. Это подчеркивается тонкой линией, соединяющей вер­
шины всех полос в гистограмме, хотя ось X была номинальной переменной.
3. Предположим, что М-гистограмма интерпретируется как описание три­
номиальной совокупности, a L и R -гистограммы интерпретируются как вы­
борки из 20 субъектов, которые выбраны из этой популяции. Тогда выборка,
чей порядок совпадает с порядком М-гистограммы, является менее вероятной
выборкой. Например, на Рисунке 1, М описывает триномиальную совокупность
с параметрами 0.35, 0.40, и 0.025. Вероятность того, что взята выборка R (то
есть, 10 зеленых, 3 желтых и 7 красных бусинок), а не выборка L (то есть, 4
зеленых, 14 желтых и 2 красные бусинки) - приблизительно 8 к 5, т. к.

P(L 1м ) _ (20!/4il4!2!) x (0.35)4(0.40j4(0.25)2_ Q6U1


P(R IM) (20!/10!3!7!) X(0.35f(0.40/ (0.25)7

Таким образом, R - более вероятная выборка.


4. Предположим, наоборот, что L и R интерпретируются к ак совокупно­
сти, а М к а к выборка. Появление выборки М наименее вероятно из совокуп­
ности, с которой у нее совпадает порядок. Например, на Рисунке 1, М опи­
сывает выборку из 7 зеленых, 8 ж елты х и 5 красных бусинок. Вероятность
того, что М скорее взята из совокупности R (то есть, параметры 0 .5 0 ,0 .1 5 , и
0.35), чем из совокупности L (то есть, параметры 0.20, 0.70, и 0.10) - при­
близительно 7 к 5, т.к.

Р(М IL) (20!/7!815!) (0.20)’ (0.70/(0.10)’


Р(М | R) (20!/7!8!5!) (0.50)7(0.15Д0.35)5

Таким образом, R - более вероятно совокупность.


Двадцать восемь таких троек гистограмм были показаны трем различ­
ным группам испытуемых, которые руководствовались тремя различными
наборами инструкций. Одной группе было сказано, что каж дая гистограм­
ма описывает триномиальное распределение, где L и R описывают две сово­
купности, а М описывает выборку, взятую из одной из этих совокупностей.
25 испытуемых в этой группе оценивали вероятность того, взята ли выбор­
ка, отображенная в М, из совокупности L или из совокупности R. Другой
группе сказали, что М описывает триномиальную совокупность, в то время
как L и R - две триномиальные выборки. 26 испытуемых в этой группе оце­
нивали вероятность того, к а ка я из этих двух выборок взята из данной сово­
92 РЕПРЕЗЕНТАТИВНОСТЬ
купности. Этим группам сначала предоставили большой стеклянный сосуд,
заполненный зелеными, желтыми и красными бусинками. Им показали,
к а к содержимое сосуда (то есть, совокупность) может быть описано соответ­
ствующей гистограммой. В их присутствии была наугад взята выборка из
20 бусинок, а такж е было продемонстрировано ее представление в виде гис­
тограммы. Испытуемых попросили считать, что L и R являю тся совокупно­
стями, а М представляет выборку 20 бусинок, или ж е L и R — это выборки,
а М представляет совокупность, в зависимости от группы, к которой при­
надлеж али испытуемые.

А В
L R
П одобие 2 15
П одобие £ |— Д — “[“ о*— j
10 1
Вероятность выборки Вероятность совокупности
0 = 0.79 0 = 0.75

Рис. 2. Совместное распределение субъективных оценок L и R по подо­


бию в сравнении с вероятностью (A) L и R - выборки из совокупности
М или (В) - М выборка из совокупности L или R.
(Источник: Бар-Хиллер, 1974.)

Третьей и последней группе, состоящей из 25 испытуемых, не было предо­


ставлено интерпретации гистограмм, и их просто просили оценить, какая из
этих двух гистограмм, L или R, более походила на среднюю гистограмму М.
Стимул рассматривался к а к L или R согласно гистограмме, выбранной
большинством испытуемых отдельно для каждого из этих трех критериев
((1) более вероятно, что производит выборку М; (2) более вероятно, что по­
явится из совокупности М; (3) более подобен М).
Двумя основными результатами этого исследования были:
1. Эмпирические оценки подобия, представленные испытуемыми, абсо­
лютно совпали с априорным критерием подобия, выраженным в свойстве
2, обозначенном выше. Другими словами, для всех 28 стимулов, более чем
80% испытуемых решили, что М более подобно гистограмме, в которой вы ­
соты цветных полос были упорядочены таким ж е образом.
2. Упорядочение L n R n o признаку вероятности, в качестве выборок, либо
в качестве совокупностей, коррелировались с их упорядочением по подо­
бию. Из 17 троек гистограмм, в которых было оценено, что R более подобно
М, только двум была присуща м алая вероятность того, что они являются
выборками, и четырем, что они являю тся совокупностями. Из этих 11 вы ­
борок, в которых было оценено, что L более подобно М, только одна была
оценена ниж е, чем R, в качестве выборки. Таким образом, упорядочение по
подобию не совпадало с упорядочением по вероятности в менее чем 13 % сти­
Изучение репрезентативности 93
мулов. Совместное распределение суждений подобия с оценками вероятно­
стей дана на Рисунке 2; где в (A) L и R — выборки, а в (В) - совокупности.
Коэффициент корреляции ф между оценками вероятности к ак выборок
и ранжированием вероятности к ак совокупности был 0.75, что примерно
столь ж е высоко, к ак корреляции ф между оценками по вероятности и ран­
жированием по подобию. Это подтверждает положение о том, что испытуе­
мые в обеих группах, оценивающих вероятность, основывали свои упоря­
дочения в значительной степени на подобии, оценка же была сделана тре­
тьей группой.

З а с ч е т к а к и х особен н остей в ы б о р к и в о с п р и н и м а ю т с я р е п р е з е н ­
тативны м и?
Олсон (Olson, 197б) указал, что, хотя “понятие суждения, основанное на оцен­
ке репрезентативности, подтверждается в значительной степени, к ак экс­
периментально, так и интроспективно, в большом количестве ситуаций”,
этого недостаточно, если мы не можем определить “факторы, которые дела­
ют свойства определенной задачи или проблемы существенными на столько,
чтобы относительно них оценивать репрезентативность” (с. 608). В некото­
рых контекстах, таких к ак исследование подобия и вероятности, они были
идентифицированы. В качестве еще одного примера, оказывается, что ключ,
определяющий репрезентативность вт тборки для неупорядоченных выбо­
рок различного размера, взяты х из некоторого распределения Бернулли,
не соответствует пропорции “успехов” в выборке и соответствующему пара­
метру совокупности (Kaheman и Tversky, 1972b, 3). Исследование, которое
я сейчас опишу (Bar-Hillel, 1980b), предлагает общую методологию для
идентификации особенностей выборок из любой популяции, определяю­
щ их репрезентативность. Это можно пояснить на примере попытки иден­
тифицировать признаки, которые определяют репрезентативность выборок
(трех наблюдений) взяты х из функции распределения (например, нормаль­
ного), по форме напоминающей колокол.
Основной принцип прост: если мы предполагаем, что суждения репрезен­
тативности и вероятности определены в соответствии с одними и теми ж е су­
щественными свойствами, то эти свойства могут быть обнаружены, за счет
опроса, в котором испытуемым предлагается определить вероятности для не­
которого набора выборок. Эта процедура меняет роли вероятности и репре­
зентативности. Другими словами, оценки вероятности используются не для
того, чтобы подтвердить репрезентативность, а чтобы ее вывести. Однако если
попросить испытуемых оценить выборки непосредственно на основе репре­
зентативности, то это может рассматриваться как спорный вопрос. Они мо­
гут возразить: “Что Вы подразумеваете под репрезентативностью?” Вместо
этого, предложенная стратегия заменяет собой ясный, однозначный вопрос
(“К акая из этих выборок, более вероятно, взята наугад из этой совокупнос­
ти?”), который, согласно стандартным посылкам, имеет нормативный ответ.
94 РЕПРЕЗЕНТАТИВНОСТЬ
Испытуемым предложили подобную задачу:
Средний рост студентов американских колледжей -175 см. Из офиса секретаря коллед­
ж а были наугад взяты три файла, принадлежащие Джону, Майку и Бобу. Какой ре­
зультат является более вероятным для роста трех молодых людей?

Д ж о н -1 7 8 см М а й к -1 7 0 см
Б о б -1 7 6 см
или
Джон - 177 см Майк - 177 см Боб - 177 см
Ф актические данные отличались в различных документах и их можно
найти в колонках стимулов Таблицы 1 (вышеупомянутый пример соответ­
ствует строке 1). Систематически изменяя используемые числа, можно было
проверить только то, какие особенности выборок, и в каком порядке, опре­
деляли ответы испытуемых. Прежде, чем я предложу вашему вниманию
обобщенную картину, вот несколько пояснений чтобы, помочь читателю
понять таблицу.
1. Выборка обозначалась как А всегда, когда она воспринималась как
более вероятная, чем выборка, с которой она ш ла в паре. В первоначальных
формах вопросника, выборки А появлялись справа так ж е часто, к а к и сле­
ва. Точная пропорция испытуемых, которые выбрали А, а не В, приведена в
колонках ответов.
2. Выборку, которая является более вероятной с нормативной точки зре­
н ия, можно увидеть в колонке статистических измерений. Выборка А бо­
лее вероятна, чем выборка В тогда и только тогда, когда Р (А) /Р (В) > 1, то
есть, когда

/(* ■ )« /(* ,) * / ( * ^
f W * f ( Y 2) * f ( Y 3)

где А = [Xj, Х 2, Х 3], В = [Yj, Y3, Y3]. Это отношение было вычислено для
ф ункции с нормальной плотностью при (л= 175 см, сг=6 см. Так к а к статис­
тически правильный ответ появляется в столбцах А и В одинаково часто,
ответы испытуемых четко связаны с этим не более, чем на случайном уров­
не.
Возможно наиболее поразительная особенность результатов, сведенных
в Таблице 1 - тот ф акт, что не существует никакого признака, на который
полагаются испытуемые, упорядочивая выборки. Например, иногда они
отбирают выборку, среднее значение которой ближе к среднему значению
совокупности (например, строка 1), а иногда они выбирают совершенно про­
тивоположное (например, строка 2). Иногда испытуемые отбирают выбор­
ку, содержащую более крайние наблюдения (например, строка 13), а иног­
да напротив (например, строка 14). Действительно, каж ется, что набор при­
знаков является важным и рассматривается некоторым последовательным
способом, к ак изображено на Рисунке 3 (количество идентичных наблюде-
о
о

§о
S
О

EH
ф
ф
к

ф
ф
ю

со
О
аcd

К
А

S3
S3

И

W
W

Я 5

cd й

JS л
Ei n
а о
JT
ьcd ©
©
оа оо

S'g
sI

2гН мw '
Д ft
МЯ

я р.
Статистика
Ответы Колмого­
Стимулы для рова-Смир­
Стимулы для выборки А Правиль­ нова
выборки В
ные ответы

ш
к
<

т
т

4/
:
>—
ЖШ
§
ДЖОН 1 Майк Боб Джон Майк
Три различия
о

0)
ю
ю
00
00
против трех
со

176
со

178 170 177 177 177 1.39

чН
гЧ

1
1—
СО

сходств
181 165 177 175 175 175 6.42 0.50
О 6

СМ со
178 170 176
СО со

175 175 175 1.59 0.50


О тН

ь- со ю
178 180 176 175 175 175 1.59 0.57 0 .5 0 #
178 180 176 177 177 177 1.39 0.57 0.63

00
О) о со ю ю

ю со
со
гН осм 00
191 189 175

с& О) 00 00 1>
175 175 1300

со 1> ю о см
см
см со см см см

гЧ
0.91 0 .5 0 #
т п т т PQ

Три различия
о

00

г>
против двух 178 170 176

1>
176 170
со

176 1.12

см
см

см
0.31
PQ

сходств
178 [ 170 176 178 170 178 0.68 0.31 0.36
СМ
6

◄ <

00 os
со ь-
Tt« со

176
со

174 175 178 170 178 0.56 0 .3 6 #


Предпочтителен
6

со
00
со

178 170
со

176 179 174 175 1.58


1> 1Л см

больший диапазон 0.31


о
6

178 170 176 177


со

| 173 176 1.43


см
г>

гЧ

огЧ гН
гЧ
СО

178 170 175 178 172

гЧ см
177 1.14 0.31 0.31
о
6

т п я

О) со со

гЧ со
1Л so

| 178 170 176 177 171 175


г>

1.14
гЧ
СО
СО
Изучение репрезентативности

Предпочтителен
о
*

<

ЯГО
О

со

178 170 176


со

меньший диапазон 179 169 177 0.31


см СМ см СО см см см С

т*Ч гЧ ю
с

178 170 176 181 165 1 177 0.23 I 0.31 0 .3 0 #

ч-Ч со
ю О> os гН 00 00 со о ю

СМ со

178 170 176 180 170 1175 0.81 0.31 0 .2 0 #

1—
< <

1> со ю
1> Tt« О)

178 170 176 181 169 175 0.60 0.31

1 гЧ
О см см

0 .1 7 #
СО со гЧ
95
96 РЕПРЕЗЕНТАТИВНОСТЬ

It-
х хь- t-
х X t—t-
1t- X X ь-
X X ь- ь- X
X X ь-It-

d о о о о о о о о о d

тЧ
СО гЧ
X t-
оо тЧ00 ь- оо оо X о X t-
X о X ь-
X
О О о о о о о о о о о

S5|s} я *и
l ч д ◄◄д ◄ < с
^а g
gl на <
я« к «
о
о
о
о
X
см о
смд t—
X гЧ X X X
X см X
It-
X X
X
тН тЧ о о о тЧ о 6 о о
ь-
X хсм хсм схм о X ь- о lt-
со см со X X X X
X

ссм
м ссо t- ь-
о см со см стЧм тЧX X д тЧод
тЧ о

0
t-0 со X 0
t- со оо X ь- X тЧ тЧ
X0 ь- X ь- X X X X
t- сь-о сXм X
t- см X
X t- X XX X
X X
X X
It- X
тЧ гЧ тЧ тЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ

о
t—
тЧ
X
тЧ
t- X X о
о X о t-
X Xо X X X од
тЧ тЧ тЧ тЧ тЧ
t-
тЧ
t-
тЧ тЧ тЧ
It- It-

сt-м X X X
t- t- X X X тЧX тЧX X
It-
тЧ
XIt-
тЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ

со
t— сt— X t—X
о t- X X t- lt-
t- ь- t- fc- X X
It-
lt-
It- It-
14 гЧ тЧ гЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ

о
t-
тЧ
о
гЧ
о
t— t- гЧ
X
X t- тЧt- Т1< тЧX
гЧ тЧ тЧ тЧ
t- X
It-
о о
ь- X X
т 4 тЧ тЧ

00
t— X t-
t- ь- X X
X тЧX X t- It-X XX X XIt- It- It-
гЧ гЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ

X
тЧ
од сом сi4м ссм
гЧ
м с0м
0 см X X ь-
X X X XX
X
я
« и
к
2 Б
-«sм о
О ч
Я О
дай 2п
i| i(Бi 2Я
||
ю3 8 & о i8
WS 5 дя
Рч. и
Изучение репрезентативности 97
ний о том, представлены ли обе стороны среднего значения выборки, сред­
нее значение и диапазон). Это усиливает мнение о том, что в независимости
от определения, предполагаемое подобие выборки, составляет собственную
концепцию . Если бы испытуемые использовали единственный признак, не
было бы необходимости назы вать это репрезентативностью. Известно, что
оценки испытуемых, каж ется, основаны на сложных соображениях о струк­
туре выборок, представляю щ их основания для вы раж ения (скорее, концеп­
туализации) их эвристического суждения на основе репрезентативности.
М ожет ли блок-схема на Рисунке 3 рассматриваться больше, чем просто
удобное и емкое резюме результатов Таблицы 1? Н асколько серьезно мож ­
но считать ее процессной моделью фактического рассуждения испытуемых
в описанной задаче? С одной стороны, очевидно, что не все особенности мо­
дели будут соответствовать - другим выборкам, другим размерам выбо­
рок, другим распределениям. Я бы, например, не утверж дала, что любая
выборка с дисперсией будет всегда оценена как более вероятная., чем лю бая
выборка без дисперсии - хотя это и сохраняется для выборок, использован­
ных в моем эксперименте. Упорядоченная модель, таким образом, являет­
ся только приближением фактической когнитивной стратегии людей. Од­
нако, будучи таковой, она обладает весомым психологическим преимущ е­
ством, являясь правдоподобной, так к ак она содержит в себе лиш ь малень­
кое число простых в вычислительном отношении признаков.
В этом пункте предлагается интересное наблюдение, которое связывает
описанное выш е исследование и настоящ ее. В исследовании гистограмм, два
вида упорядочения по вероятности сравнивались с упорядочением по подо­
бию: (а) упорядочение двух выборок по признаку более или менее вероят­
ных исходов некоторой совокупности, обозначенной Р (s/p); (b) упорядоче­
ние двух совокупностей в качестве более или менее вероятных источников
некоторой выборки, обозначенной P (p/s) (иногда называемое обратными ве­
роятностями). Эти две задачи, привели к очень близким результатам, со­
гласно которым они обе были сделаны очень похожим образом - действи­
тельно, в соответствии с гипотезой, что они были обе реш ены на основе
репрезентативности (то есть, в данном случае, визуального подобия). Суще­
ствует статистическая концепция, которая является аналогичной психоло­
гической концепции репрезентативности - концепции степени соответствия.
Измерение степени соответствия типично используется в проверке гипоте­
зы, когда неизвестна совокупность, породивш ая некоторую известную вы ­
борку, при отсутствии информации о предполагаемой вероятности. Таким
образом, при оценке совокупностей, репрезентативность, каж ется, более со­
ответствует концепции степени соответствия между выборкой и совокуп­
ностью, чем концепции вероятности совокупности, условной для некото­
рой выборки, Р (p/s).
В исследовании распределения роста, однако, была предложена совокуп­
ность, которая являлась источником для выборок. Поэтому, испытуемым
не приходилось оценивать ни обратные вероятности, ни степень соответ-
98 РЕПРЕЗЕНТАТИВНОСТЬ

Какая из двух выборок имеет | --------------------------------


" ” "в 3 идентичных наблюдения? |

ни одна обе
7-28
ш ЛL
. А Какая из выборок имеет среднее Ц üw Я»
■ и ------------------- — значение, ближе к \l? ß ^
Ш4

Ü г**1
идентичных наблюдения?
7,8,9
ни одна обе

ни одна 25-28 обе


1
10-17
Какая из выборок иреет К
----------- r j среднее значение, ближе к ц? щ
! 25-28
1
!
имеет
ИНН
( 10, 11,
! 15| 17 I
.! 12-14JIK
•к *12 Какая из выборок ир<«ет ft-
среднее знамение, ближе кр? К

13-14,16 также

Обе выборки оценены как


одинаково вероятные

Рис, 3. Блок-схема, суммирую щ ая признаки и последовательность,


в которой они использовались для упорядочения выборок по веро­
ятности.
(Источник: Бар-Х иллел, 1980b.)

ствия. Однако, интересно, смогут ли их оценки, так или иначе, быть пере­
строены в качестве интуитивной попы тки оценить последнее.
Одно из возмож ны х измерений степени соответствия между выборками
из трех элементов и нормальным распределением - одно-выборочная, дву­
сторонняя статистика Колмогорова-Смирнова (КС) (см., например, Siegel,
1956, стр. 47-52). Эта статистика интерпретируется так, что чем больше зна­
чение (максимальное расстояние между ф ункциями распределения выбор­
ки и совокупности), тем менее вероятно, что эта выборка взята наугад из
совокупности. В последних двух столбцах Таблицы 1 приведена статистика
КС для каж дой из исследуемых выборок. В 18 парах, распределение выбо­
рок по статистике КС согласовывалось с их распределением большинством
Изучение репрезентативности 99
испытуемых; в 3 парах статистика КС бы ла выровнена (в 1 из которых, стро­
ка 12, испытуемые такж е были ф актически единодушны), а в 7 парах (от­
меченных в Таблице 1 звездочками) распределения различны .
Это мало влияет на сравнение степени согласованности между распреде­
лением КС и распределением, произведенным испытуемыми, со степенью
согласованности между нормативным распределением и распределением
испытуемых (в последнем приш ли к согласию в 13 из 28 стимулов), так как
последние цифры - только побочные продукты отдельно взяты х стимулов,
которые не были наугад отобраны из всех возможных стимулов. Намного
важнее рассмотреть, где модель иерархических особенностей отличается от
модели “степени соответствия”. Случаи, где распределение КС было согла­
совано, а распределение испытуемых не было (строки 2 1 ,2 7 , и в небольшой
степени 12) могут быть приписаны значениям КС, вычисленным со стан­
дартным отклонением в б см. Это привело к появлению выборки (181,169,
175) (выборка В, строка 17), которая имеет диапазон 12 см, при самом м а­
леньком значении КС, когда “идеальны й” (то есть, наиболее репрезентатив­
ный) диапазон в оценках испытуемых был несколько меньшим - от 8 до 10 см.
Так к ак мы никак не можем, на основе имеющ ихся данных, установить стан­
дартное отклонение субъективного распределения роста, становится непо­
нятно, к ак поступить с этим несоответствием.
Другой вид несоответствия, к которому относятся строки 4, б, 9, и с 14-
17, происходит, потому что модель КС, а не иерархическая модель, предус­
матривает компенсацию. Другими словами, если некоторая выборка имеет
“недостаток” (как, например, она может состоять из трех идентичны х на­
блюдений, или представлять только половину ф ункции совокупности), ис­
пытуемые считаю т, что она менее репрезентативна, чем любая выборка без
недостатка, но модель КС рассматривает такж е факторы , которые находят­
ся ниж е в иерархической модели. К ак я упомянула выш е, иерархический
характер предложенной модели процесса должен быть расценен как при­
ближение, поэтому рассматриваемое несоответствие является скорее несо­
ответствием степени, чем вида.
Другие измерения степени соответствия вычислены статистиками. То,
что они не приш ли к согласию, указы вает, что свойство, которое они наме­
реваю тся изм ерять, не ясно и не точно определено. Х отя у опытного статис­
тика интуиция бсГлее развита, чем у неподготовленного испытуемого, они
оба могут пы таться искать одно и то ж е базовое понятие. До настоящ его вре­
мени, даж е усилия статистиков в этом направлении не увенчались большим
успехом.

Р о л ь р а з м е р а в о ц ен к е в ы б о р к и
Некоторые характеристики выборок соответствуют некоторым параметрам
совокупности; эти характеристики называю тся статистикой выборки. К ним
обычно применялась эвристика репрезентативности, когда репрезентатив­
100 РЕПРЕЗЕНТАТИВНОСТЬ
ность эквивалентна подобию или приближенности статистики выборки к
соответствующим параметрам популяции. Я назову это первичным смыс­
лом репрезентативности. Но выборки могут быть описаны в терминах про­
цедуры , посредством которой они такж е были получены. Н апример, выбор­
к а мож ет быть осуществлена с возвращ ением или без; из известной сово­
купности или неизвестной; и т. д . Возможно, к ним такж е могло прим енять­
ся понятие репрезентативности. Таким образом, люди могут (и имеется к у ­
рьезное свидетельство, что это так) оценивать выборку, взятую наугад, как
менее репрезентативную , чем стратифицированную выборку, или ж е боль­
ш ую вы борку, к а к более репрезентативную , чем маленькую (B ar-H illel,
1980b). Я назову это вторичным смыслом репрезентативности. Так к ак это
касается методов осущ ествления выборки, а не последующей статистики
выборок, репрезентативность во вторичном смысле отраж ает ож идания от­
носительно репрезентативности в первичном смысле. Другими словами,
чтобы оценить большую выборку к ак более репрезентативную , чем малень­
кую , стоит ож идать, что ее “сущ ественные особенности” или “сущ ествен­
ные свойства” лучш е отразят “существенные особенности” или “существен­
ные свойства” совокупности, до того, к ак будет сказано, каковы они на са­
мом деле.
Экспериментальные проблемы, которые я опишу в последней главе, были
посвящ ены рассмотрению вторичного смысла репрезентативности, по от­
ношению к размеру выборки.
Проблема 1: Две фирмы, специализирующиеся в изучении общественного мнения, про­
водят наблюдение с целью определения пропорции избирателей, намеревающихся про­
голосовать положительно на некоем референдуме. Фирма А рассматривает выборку из
4 0 0 человек. Фирма В рассматривает выборку из 1 .0 0 0 человек. В чьей оценке Вы были
бы более уверены?

Фирмы А ___ Фирмы В ______ Приблизительно поровну______

Эта задача и два ее варианта (в которы х, соответственно, была добавлена


инф орм ация, что полны й размер рассмотренного общ ества был 8. 000 и
50.000 соответственно), была предоставлена 7 2 испытуемым. Более чем 80%
из них были больше уверены в достоверности большей выборки, по сравне­
нию только с 4% , отдавш им предпочтение меньш ей выборке.
Если просто сделать вывод о том, что чем больш е вы борка, тем более
репрезентативной она каж ется (то есть, ож идается, что она будет более точ­
ной или надеж ной), то эти результаты были бы слиш ком тривиальны , что­
бы о них говорить. Вовсе не размер выборки сам по себе определяет ее репре­
зентативность, а скорее что-то более близкое к отношению между размером
выборки и размером совокупности. Если рассматриваемые выборки, взяты
и з одной и той ж е совокупности, линейно связаны , то они будут одинаково
распределены. Если размер совокупности изменяется такж е, как и размер
выборки, различие становится очевидным. Рассмотрим следующую задачу:
Изучение репрезентативности 101
Задача 2: Две фирмы, специализирующиеся в изучении общественного мнения, прово­
дят наблюдение с целью определения пропорции избирателей, намеревающихся про­
голосовать положительно на некоем референдуме каждая в своем городе.
Фирма А работает в городе, где 1 миллион избирателей.
Фирма В работает в городе, где 50. 000 избирателей.
Обе фирмы формируют выборку, выбирая одного человека из кажды х 1 .0 0 0 избирате­
лей. В чьей оценке Вы были бы более уверены?_______

Здесь, хотя фирма А имеет выборку из 1 .0 0 0 человек, а Ф ирма В только из


50, процент испытуемых, которые вы разили больше уверенности в досто­
верности большей выборки, понизился до 50% , тогда к ак 29% указали рав­
ную уверенность относительно обеих выборок. В другой группе испытуемых,
которым сказали, что обе фирмы сделали выборку 1. 000 человек (нежели
чем 1 из каж дой 1 .0 0 0 ), 9% проявили одинаковую уверенность в достовер­
ности обеих выборок, по сравнению с 62% , которые были более уверены в
выборке людей, голосовавш их в меньш ем городе. П ояснительные тексты,
составленные испытуемым, подтвердили то, что они рассматривали пропор­
циональные размеры выборок, к ак и абсолютные размеры.
Иногда отношение “выборка-совокупность” является действительно важ ­
ным для оценивания выборки - например, когда формирование выборки
сделано без возвращ ения и особенно, когда выборка представляет собой до­
статочно большую часть совокупности. Однако если формирование выбор­
ки сделано с возвращ ением (то есть, совокупность бесконечно велика), или
если в выборку берется только м алая часть большой совокупности (которая
отраж ает совокупность, для всех прагматических целей), тогда рассмотре­
ние относительного размера теряет смысл наряду с рассмотрением абсолют­
ного размера.
Задача 3: Даны два закрытых сосуда. В обоих - смесь красных и зеленых бусинок. Ко­
личество бусинок различно в двух сосудах - в маленьком 10 бусинок, а в большом - 1 0 0
бусинок. Процент красных и зеленых бусинок один и тот же в обоих сосудах. Выборка
осуществляется следующим образом: Вы вслепую достаете бусинку из сосуда, запоми­
наете ее цвет и возвращаете на место. Вы перемешиваете бусинки, снова достаете всле­
пую, и снова запоминаете цвет. В общем, Вы тянете бусинку из маленького сосуда 9
раз, а из большого - 1 5 раз. Как Вы думаете, в каком случае у Вас больше возможностей
угадать преобладающий цвет?

Так к ак процедура формирования выборки, описанная в задаче 3 - с воз­


вращением, то число бусинок в этих двух сосудах с нормативной точки зрения
абсолютно не важно. Испытуемые в своих выборах должны были однозначно
обратить внимание на большую выборку в 15 бусинок. Вместо этого, 72 из 110
испытуемых выбрали меньшую выборку из 9 бусинок. Это можно объяснить
только тем, что отношение размера выборки к размеру совокупности - 90% в
последнем случае и только 15% в первом. Другие результаты, к которым при­
ш ла Бар-Х иллел (Bar-Hillel, 1979), подтверждают этот ж е вывод.
Таким образом, согласно статистике выборок, если кандидаты на роль
“основных свойств“ неизвестны, эту роль может принять на себя размер
102 РЕПРЕЗЕНТАТИВНОСТЬ
вы борки. Люди понимают, что размер - важное свойство выборок. Почему
ж е они не в состоянии перенести это понимание на первичный смысл репре­
зентативности? Другими словами, если люди полагают, что большие выбор­
ки будут более репрезентативны по отношению к совокупности, из которой
они получены, чем меньш ие, почему они не в состоянии оценить некоторые
ненормативные результаты (например, пропорция выборки 60% , взятой из
популяции, характеризую щ ейся 50% пропорциональностью ) к ак менее
вероятны е в больш их, а не в меньш их выборках?
Возможно оценка того, что некоторы й результат формирования выбор­
ки является менее вероятным в больш их вы борках, зависит от восприятия
его к а к нерепрезентативного. С нормативной точки зрения, только та вы ­
борка является “точной”, среднее значение которой идентично среднему зна­
чению совокупности. Все другие неточны, хотя несколько точнее, чем дру­
гие. С психологической точки зрения, результаты формирования выборок
могут быть оценены к ак репрезентативные, даж е если они отклоняю тся по
некоторым параметрам от параметров совокупности. Возможно, значение
60% не воспринимается к ак нерепрезентативное и поэтому не вы зывает у
испытуемых вторичного чувства репрезентативности.
Чтобы проверить эту возможность, я дала испытуемым несколько вари­
антов проблемы рождаемости согласно Канеману и Тверскому (1972b, 3)
Некоторый город обслуживается двумя больницами. В большей больнице каждый день
рождается приблизительно 45 младенцев, а в меньшей больнице, приблизительно 15
младенцев. Как Вы знаете, приблизительно 50% всех младенцев - мальчики. Точный
процент младенцев-мальчиков, однако, изменяется каждый день. Иногда он может быть
выше, чем 50% , иногда ниже.
В течение 1 года, каждая больница делала учет дней, на которые приходится (больше /
меньше) 60% рожденных младенцев-мальчиков. Какая больница, как Вы думаете, сде­
лала запись большего количества таких дней? (1972b, с. 443)

В отдельных задачах, выполняемы х отдельными группами, пропорция


мальчиков бы ла изменена с 60% до 70% , 80% и 100% . В таблице 2 показа­
но влияние этого изменения на распределение ответов испытуемых.
В торая колонка точно повторяет, и в задаче, и в результатах, версию Ка-
нем ана и Тверского. Но заметьте, что, к ак только пропорция мальчиков
превы ш ает 70% , модальным ответом становится “меньш ая больница”, что
является правильны м ответом. А когда сказано, что все младенцы - маль­
чи ки , “м еньш ая больница” является даж е ответом у больш инства. Соглас­
но другому набору задач, пропорция была меньш е чем 60% , 70% или 80% .
В этом случае везде был модальный ответ “одинаково”.
Эти результаты говорят о том, что, как только результат формирования
выборок воспринят к ак нерепрезентативный, размер выборки будет играть
надлеж ащ ую роль в оценке выборки лю дьми, возможно, потому что мень­
ш ий размер более совместим с нерепрезентативны ми результатам и, чем
больш ий. Однако если результат формирования нельзя назвать нерепрезен­
тативным, люди не принимают во внимание размер выборки. Размеры, боль­
Изучение репрезентативности 103
ше чем 70% , каж ется, закодированы к ак нерепрезентативные. Размеры
50% и вклю чительно - нет.
Таблица 2. Пропорция тестируемых, выполнявших задачу о рождаемос­
ти (различные варианты).

1 более более
1
более 60% * 100% *
70% ь 80% "

большая 24% 20% 25% 26% 19%

меньш ая 20% 20% 43% 42% 54%

одинаково 56% 60% 60% 32% 27%

N 50 40 28 27 41

м енее 60% * м енее 70% 6 м енее 80% ь

большая 20% 31% 29%

меньш ая 24% 28% 25%

одинаково 56% 41% 46%


N 45 29 28

аКанеман и Тверски
ь ранее неопубликованные данные, Бар-Х иллер
сиз Бар-Х иллер (1979). Здесь, больш ая и м аленькая больницы по 15 и 5 м ла­
денцев, соответственно

Обсуждение
В этой главе представлены выводы о трех исследованиях оценок субъектив­
ной вероятности, которы е рассматриваю т понятие репрезентативности.
Однако каж дое и з них касается его в разной мере.
Первое исследование - это прям ая демонстрация того, что оценки подобия
и вероятности связаны . В отличие от многих других задач, которые проверя­
ли эту гипотезу (см., напр., Kanem an & Tversky, 19726,3; 1973,4), в данном
случае испытуемых нельзя обвинить ни в неспособности учитывать другие
соображения (или, хотя бы очевидные или простые), ни в том, что они прида­
ют слиш ком большое значение ошибочным или нерелевантным соображени­
ям. Кстати, исклю чая подсчет вероятности, которую их просили оценить,
испытуемым ничего не оставалось, к ак использовать ту стратегию, которой
они пользовались. Это иногда уменьшает показательную силу. Если учиты­
вать и другие результаты, можно увидеть, насколько непреодолимыми мо­
гут быть соображения подобия - даж е простого визуального типа - при оце­
нивании сложных событий, путем подсчетов или концептуально.
До исследования характерны х свойств выборок, тесты репрезентативно­
сти изначально рассматривали совокупности с одним параметром или при­
знаком с одним измерением. Это позволило сформировать непосредствен­
ное и априорное оценивание стимулов по подобию, не вы зы вая необходимо­
сти в независимы х оценках, полученных экспериментальным путем. (Как
бы там ни было, некоторые “очевидные” признаки позж е были подвергну­
ты сомнению (см., напр., Olson, 1976)). Но когда стимулы усложняю тся,
отнош ения подобия между ним и становятся менее очевидными, так к ак
многие признаки влияю т на общую оценку. В этом исследовании использо­
валась установленная к тому времени корреляция между вероятностью и
репрезентативностью , чтобы показать, к ак последняя определяется в вы ­
борках, характеризую щ ихся более чем одним признаком.
Часто лучш им способом обнаружить, насколько подобны два стимула,
является прямо спросить о подобии. Это немного проблематично, если необ­
ходимо узнать, насколько выборка S репрезентативна совокупности Р. Одна­
ко полезно уметь оценить это косвенно, например, спросив, насколько веро­
ятно то, что выборка S взята из совокупности Р. Второе исследование в этой
главе показы вает жизнеспособность этого подхода, давая описание того, ка­
кие свойства выборок делают их репрезентативными в некотором контексте.
Н аконец, в третьем исследовании подчеркивается важное различие м еж ­
ду репрезентативностью выборки и репрезентативностью результата фор­
мирования выборки. В первичном смысле, репрезентативность - это оцен­
к а , которая приписывается результатам формирования выборки. Другими
словами, чтобы оценить, насколько выборка репрезентативна популяции в
этом смысле, долж ны быть известны характеристики обеих. Таким обра­
зом, имеет смысл оценивать репрезентативность выборки из 15 новорож­
денны х, 9 из которых м альчики, им ея перед глазами общее распределение
пола среди новорожденных (известную пропорцию мальчиков). Нет смыс­
ла оценивать репрезентативность этой выборки, если пропорция мальчи­
ков ни в выборке, ни в популяции не известна. Но существует и другой смысл
репрезентативности, который сделает значимой такж е и вторую оценку. В
этом смысле, выборки более репрезентативны, если их оцениваю т как бо­
лее вероятные в первом смысле. Другими словами, независимо от средней
величины совокупности и до того к ак становится известна средняя величи­
на вы борки, вы борка из 45 новорожденных более репрезентативна (во вто­
ром смысле), чем выборка из 15, потому что она с большей вероятностью
будет напоминать популяцию , если станет известна в ней пропорция м аль­
чиков. Следовательно, в выборке из 45 мож ет оказаться 65% м альчиков, а
в выборке и з 15 - 53 % . Но если четко различать эти два смы сла, путаницы
не возникнет.
В третьем исследовании показано, что люди реагирую т на размер выбор­
к и , когда делают вторичные оценки репрезентативности, даж е если они ч а­
сто не видят подтекст, который обычно бывает у первичных и стандартных
оценок репрезентативности.
6. Оценки репрезентативности и на основе
репрезентативности*

Амос Тверски иДаниелъ Канеман

Н есколько лет назад, мы представили анализ принятия реш ений в услови­


ях неопределенности, который связал субъективные вероятности и интуи­
тивные прогнозирования по поводу ож иданий и впечатлений о репрезента­
тивности. В эту концепцию вклю чили две различные гипотезы: (i) люди ож и­
дают, что выборки будут подобными своей родительской совокупности, а
такж е отобразят случайность процесса формирования выборки (Tversky &
K ahnem an, 1971, 2; 1974,1); (ii) люди часто полагаю тся на репрезентатив­
ность к а к на эври сти ку д л я суж дения и прогнозирования (T versky &
K ahnem an, 1972b, 3; 1973, 4).
П ервая гипотеза была выдвинута для объяснения общего м нения, что
случайные процессы самокорректирую тся, то есть наблюдается преувели­
ченная вера в стабильность исходов, наблюдаемых в м алы х выборках, про­
игрыш ей в казино и связанны е с этим предубеждения относительно оценок
случайности. Мы предположили, что околонаучная концепция случая сти­
мулирует веру в закон малых чисел, согласно которому даже небольшие
выборки являю тся высоко репрезентативными по отношению к их роди­
тельским совокупностям (Tversky & K ahnem an, 1971,2). Подобная гипоте­
за могла такж е объяснить общую тенденцию к преувеличению непротиво­
речивости и прогнозированной ценности черт характера личности (M ischei,
1979) и слиш ком высокому оцениванию корреляции между подобными пе­
ременными (см. Главу 15) и типами поведения (Shweder и D’A ndrad, 1980).
Люди, каж ется, верят в голограммоподобную модель личности, в которой
лю бой а к т п о в ед е н и я п р е д с т а в л я е т и сти н н ы й х а р а к т е р ч ел о в е к а
(K ahnem an,& Tversky 1973, 4).
Гипотеза, согласно которой люди ожидаю т, что выборки будут высоко
репрезентативны по отношению к их родительской совокупности, концеп­

*Эта работа была поддержана Службой Военно-морских Исследований согласно Контракту


N00014-79-C-0077 с Университетом Стэнфорда.
туально независима от другой гипотезы , согласно которой люди часто ис­
пользую т эвристику репрезентативности, чтобы предсказывать и оценивать
вероятности. То есть они часто оцениваю т вероятность неопределенного со­
бы тия или выборки «степенью, в которой они (i) подобны в существенных
свойствах своей родительской совокупности и (ii) отражаю т существенные
особенности процесса, который послуж ил основанием для их возникнове­
н и я” (K ahnem an & Tversky, 1972b, с. 431, 3). Эта гипотеза изучалась в не­
скольких контекстах, вклю чая интуитивные статистические оценки и про­
гнозирование выбора профессии (K ahnem an & Tversky, 1972b, 3; 1973,4).
Обе гипотезы репрезентативности использовались для объяснения раз­
нообразия наблюдений, таких к ак относительная неэффективность инфор­
мации консенсуса и использования подобия в интерпретации проективных
тестов (N isbett и Ross, 1980). Эти гипотезы такж е определили направление
поиска существенных наруш ений нормативных правил в интуитивных суж ­
дениях, что дало хорошие результаты. Больш ая часть этого исследования
касалась оценок, сделанных на основе репрезентативности, то есть роли реп­
резентативности в прогнозировании и при составлении заклю чений. Отно­
сительно мало работ было посвящено оценкам репрезентативности, то есть
характеру этого отнош ения и его показателей, вне контекста случайного
осущ ествления выборки (B ar-H illel, 1980b). П ервая глава этой части книги
описывает природу репрезентативности, а такж е условия, в которы х кон­
цепция репрезентативности позволяет объяснить интуитивны е прогнозы и
оценки вероятности. Во второй главе мы проиллюстрируем различие м еж ­
ду логикой репрезентативности и логикой вероятности в оценке вероятнос­
ти слож ны х событий.

Отношение репрезентативности
Репрезентативность - это соотношение между процессом или моделью М и
некоторым случаем или событием X , связанны м с этой моделью. Репрезен­
тативность, к ак и подобие, может быть определена опытным путем, напри­
мер, если попросить людей оценить, какое из двух событий, Х 1или Х2, яв­
ляется более репрезентативным по отношению к некоторой модели М, или
является ли событие X более репрезентативным по отношению к Mt или М2.
Рассм атриваемая модель могла относится к человеку, монете или мировой
экономике, а соответствующие исходы могли быть описанием, последова­
тельностью вы падения орлов и реш ек или ценой н а золото.
Репрезентативность - направленное соотношение: мы говорим, что вы ­
борка более или менее репрезентативна по отношению к отдельно взятой
совокупности, и что действие является репрезентативным по отношению к
человеку. Мы обычно не говорим, что совокупность репрезентативна по от­
ношению к выборке, или что человек репрезентативен по отношению к дей­
ствию. В некоторых задачах, однако, можно полностью изменить роли мо­
дели и исхода. Н апример, можно оценивать, репрезентативен ли человек
Оценки репрезентативности и на основе... 107
стереотипу библиотекаря или репрезентативно ли занятие библиотекаря
этому человеку.
Мы различаем четыре основных случая, для реш ения которых обычно
используется концепция репрезентативности.
1. М — класс, а X — значение переменной, определенной в этом классе.
Именно в этом смысле мы говорим о (более или менее) репрезентативных раз­
мерах дохода профессора колледжа или возрасте вступления в брак в какой-
либо культуре. Естественно, наиболее репрезентативная величина будет близ­
ка к средней, медиане или способу распределения соответствующей перемен­
ной в классе М. Отношение репрезентативности, главным образом, определе­
но в этом случае так, что испытуемый знает распределение частоты соответ­
ствующей переменной.
2. М — класс, а X — частный случай этого класса. Больш инство чита­
телей, вероятно, согласится, что Джон А пдайк — более репрезентативный
американский писатель, чем Норман М айлер (N orm an M ailer). Конечно, та­
кое суждение не основано на частоте; оно отраж ает степень, в которой сти­
ли, темы и идеи этих авторов являю тся центральными в современной аме­
риканской литературе. Подобные соображения определяют репрезентатив­
ность случаев, которые сами скорее являю тся классами, чем частными слу­
чаям и. Например, дрозд считается более типичной птицей, чем курица, хотя
он встречается реже (Rosh, 1978; Sm ith, Shoben и R ips, 1974). Таким обра­
зом, событие репрезентативно по отношению к категории, если оно имеет
сущ ественные особенности, которыми обладают элементы этой категории,
и если у него отсутствуют отличительные черты , которых нет у членов этой
категории (Rosh, 1975; Tversky, 1977).
Современные разработки в области формирования концепции (Rosh &
M ervis, 1975; M ervis & Rosh, 1981), семантической пам яти (B ransford &
F ranks, 1971) и распознавания образов (P osner& K eele, 1968) показали, что
наиболее репрезентативные, или прототипные, элементы категории лучш е
запоминаю тся, легче вспоминаю тся и распознаю тся, чем элементы, кото­
рые являю тся более часты ми, но менее репрезентативными. Кроме того,
люди часто допускают ош ибку, “распознавая” прототипный стимул, кото­
рый никогда не демонстрировался. Поэтому репрезентативность может сме­
щ ать пам ять распознавания, а такж е оценки частоты.
Надо заметить, что существуют два способа, с помощью которых элемент
может быть высоко репрезентативен по отношению к классу. Два смысла
репрезентативности близко соответствуют отнош ениям типичности и про­
тотипичности . Элемент высоко репрезентативен по отношению к категории,
если он типичен или модален; он может такж е быть репрезентативен, если
он является идеальным типом, который воплощ ает сущность категории.
Например, Нью-Йорк является прототипом американского города, в то вре­
мя как Ц инциннати можно выбрать как типичный город. Точно так ж е наши
понятия о прототипе и типичной француженке различаются. Первая — веро­
108 РЕПРЕЗЕНТАТИВНОСТЬ
ятно молодая, и зящ н ая париж анка, в то время к ак вторая будет полной
ж енщ иной средних лет из провинции.
3. М — класс, а X — подкласс М. Больш инство людей, вероятно, согла­
сится, что население Ф лориды менее репрезентативно по отношению к аме­
риканском у населению, чем население ш тата И ллинойс, и что студенты,
изучаю щ ие астрономию, являю тся менее репрезентативными по отнош е­
нию ко всему студенчеству, чем студенты, изучаю щ ие психологию. К рите­
рии репрезентативности различны для подкласса и для отдельного события,
потому что событие м ож ет давать представление о главной тенденции
свойств, в то врем я к ак , подкласс мож ет такж е представлять диапазон и
изменчивость. Человек, чей рост, вес, возраст и доход соответствует сред­
ним величинам для американского населения, репрезентативен по отноше­
нию к этой совокупности. Группа из 100 человек с одними и теми ж е харак­
теристиками не смогла бы представлять изменчивость признаков.
Если класс М состоит из таких отдельных групп, что изменчивость в пре­
делах каж дой группы является очень маленькой относительно изменчиво­
сти между группами, мы рассматриваем каж дую группу скорее к ак пред­
ставителя категории, чем как подкласс. Таким образом, естественно рас­
сматривать “дрозда” к ак вид птиц или к ак частны й случай категории “пти­
ц а”, хотя множество “дрозды” является подклассом класса птиц. В общем
смысле (2) может рассматриваться к ак частны й случай (3), где подкласс X
состоит из одного члена. Точно так ж е (1) может расцениваться к ак вариант
(2) с одним изм ерением . Три типа репрезентативности различаю тся по
слож ности X , где (1) — одноэлементное событие с единственным призна­
ком , (2) — одноэлементное событие с множеством признаков и (3) — много­
элементное событие с одним или более признаком.
Особенно важ ны й пример репрезентативности подкласса имеет место,
когда X является случайной выборкой из указанной совокупности. Случай­
н ая выборка долж на представлять случайность процесса выбора, а не толь­
ко сущ ественные особенности совокупности, из которой она взята. Когда
100 человек отобраны наугад, например, выборка из 53 муж чин и 47 ж ен ­
щ ин мож ет показаться более репрезентативной, чем выборка из 50 муж чин
и 50 ж енщ ин, потому что первая представляет неравномерность формиро­
вания выборки, в то время к ак последняя— нет (Tversky & K ahnem an, 1972b,
3). С татистическая концепция репрезентативной вы борки исследована
Крускалом (K ruskal) и М остеллером (M osteller) (1979а, 1979b).
4. М — (причинная) система, а X — (возможное) последствие. Этот
случай отличается от предшествующих, тем, что М больше не является клас­
сом объектов или случаев, а скорее системой, которая порождает различ­
ные эффекты . Н апример, М может представлять экономику США, а X —
степень инф ляции, или М может представлять человека, а X действие, вы ­
полненное М, например, развод, самоубийство, выбор профессии. Здесь, X
репрезентативно по отношению к М, или потому что оно часто связано с М
(например, вы сокая температура обычно сопровождает пневмонию) или
Оценки репрезентативности и на основе... 109
потому что люди верят, правильно или неправильно, что М — это причина
X (например, вы сш ая мера наказания предотвращ ает похищ ения людей).
Тверски и Канеман (1980,8) проиллю стрировали и исследовали вклю чение
причинных схем в оценки условных вероятностей.
Подводя итоги, отношение репрезентативности может быть определено
для (1) величины и распределения, (2) события и категории, (3) выборки и
совокупности (4) причины и следствия. Во всех четырех случаях, репрезен­
тативность вы раж ает степень соответствия между X и М, но ее показатели
не одинаковы в этих четырех случаях. В случае (1) на репрезентативность
влияет каж ущ аяся относительная частота или статистическая связь. В слу­
чаях (2) и (3) репрезентативность определена прежде всего подобием, напри­
мер, одного случая другим, или статистик выборок соответствующим пара­
метрам совокупности. Н аконец, в случае (4) репрезентативность определя­
ется в значительной степени причинны ми убеждениями (валидными или
нет).

Репрезент ат ивност ь и вероятность


Использование репрезентативности для объяснения оценок вероятности и
интуитивны х прогнозов опирается на предположения о том, что:
1. Отношение “X — (очен ь,..., нисколько не) репрезентативно М” мо­
ж ет осмысленно оцениваться испытуемыми.
2. Эти оценки не должны основываться на впечатлениях от вероятно­
сти или частоты, которые долж ны быть объяснены репрезентативнос­
тью.
3. Отношение репрезентативности имеет собственную логику, которая
систематически отклоняется от логики вероятности.
Когда эти допущ ения принимаю тся во внимание, становится интересно про­
верить, опосредованы ли оценки вероятности оценками репрезентативнос­
ти.
Оценка вероятности неопределенного события или прогноза неизвестно­
го числа — сложный процесс, которы й вклю чает интерпретацию пробле­
мы, поиск необходимой информации и выбор соответствующего ответа. Это
можно сравнить с действием гибкой компью терной программы, которая
включает множество потенциально полезных подпрограмм. В терминах этой
аналогии, эвристика репрезентативности — одна из процедур, которые мо­
гут использоваться, чтобы восстановить, интерпретировать и оценить ин­
формацию. Использование этой эвристики, конечно, не препятствует ис­
пользованию других процедур, так ж е как использование образов к ак эври­
стики для припоминания не препятствует использованию других страте­
гий. Однако уверенность в эвристике приводит к характерны м предубежде­
ниям. Н апример, когда используются образы, чтобы вспомнить людей, при­
сутствовавш их на определенной встрече, ож идается, что легче будет вспом­
110 РЕПРЕЗЕНТАТИВНОСТЬ
нить тех участников, которые находились в непосредственной видимости,
чем тех, кого не было хорошо видно. Точно так ж е использование репрезен­
тативности для оценки субъективной вероятности приводит к переоценке
одних вероятностей и недооценке других.
Ранние исследования дали основание для крайней гипотезы, согласно ко­
торой некоторые оценки вероятности основаны исключительно на репрезен­
тативности. Например, наблюдение, что субъективные выборочные распре­
деления по существу не зависят от размера выборки (Tversky & K ahnem an,
1972b, 3), привело к предположению, что люди оценивают вероятность вы ­
борки по подобию ее статистик соответствующим параметрам совокупности.
Больш инство доступных данных, однако, подтверждают более умеренную
гипотезу, согласно которой интуитивные прогнозы и оценки вероятности под­
вержены влиянию репрезентативности, хотя полностью от нее не зависят.
Таким образом, на субъективные вероятности оказывают существенное вли­
яние (нормативно) незначимые факторы, которые затрагиваю т репрезента­
тивность и они относительно независимы от (нормативно) значимых перемен­
ны х, которые не влияю т на репрезентативность. Важность предубеждений
репрезентативности и влияние таких переменных к ак размер выборки, дос­
товерность, и базовое значение зависит от характера задачи, плана экспери­
мента, опыта респондентов и наличия подсказок или других характеристик.
Роль этих факторов в исследовании суждения обсуждается далее.
Если уверенность в репрезентативности приводит к систематическим
ош ибкам, почему люди используют его к ак основание для прогнозов и оце­
нок? Ответ н а этот вопрос можно разделить на три части. Во-первых, репре­
зентативность каж ется легко доступной и легкой для оценки. Современное
исследование категоризации (M ervis & R osh, 1981; Rosh, 1978) полагает,
что понятия часто организую тся и обрабатываются в терминах прототипов
или репрезентативных примеров. Следовательно, нам легче оценить репре­
зентативность события по отношению к классу, чем оценить его условную
вероятность. Во-вторых, вероятные события обычно более репрезентатив­
ны , чем менее вероятные. Н апример, выборка, подобная совокупности, бо­
лее вероятна, чем нетипичная выборка того ж е размера. В-третьих, мнение,
что выборки вообще репрезентативны по отношению к их родительским со­
вокупностям, приводит к тому, что люди переоценивают корреляцию м еж ­
ду частотой и репрезентативностью или между статистической связью и
коннотативным подобием. Таким образом, репрезентативность использует­
ся, потому что (i) она доступна, (ii) она часто связана с вероятностью и (Ш)
люди переоцениваю т эту связь. Уверенность в репрезентативности, однако,
ведет к предсказуемым ош ибкам суж дения, потому что репрезентативность
имеет собственную логику, которая отличается от логики вероятности.
Различие меж ду репрезентативностью и вероятностью в большей степе­
ни очевидно (i), когда представлены недостоверные данные или (ii), когда
контрольное событие специфично. В случае (i), исход, который является
высоко репрезентативным по отношению к наш ей модели, может быть м а­
Оценки репрезентативности и на основе... 111
ловероятным, если наш а мы сленная модель основана на данных ограничен­
ной валидности. Рассмотрим, например, вероятность того, что к а н д и д а т ,
который произвел превосходное впечатление во время собеседования, пре­
успеет в очень трудной задаче. П оскольку известно, что впечатления от со­
беседования часто ошибочны, а успех или неудача на работе определяется
многочисленными ф акторами, которые не возможно предугадать в краткой
беседе, успех может быть маловероятен даж е, когда он высоко репрезента­
тивен по отношению к наш ему впечатлению о кандидате.
В случае (И) репрезентативный результат может быть маловероятным,
потому что он крайне специфичен или детален. Вообще, событие может быть
маловероятным либо потому, что оно нетипично, либо потому, что оно очень
детализировано. Вес менее 135 фунтов является нетипичным для человека
средних лет; а вес 157,625 фунтов является типичным, но слиш ком точно
определенным. Действительно, последнее значение более репрезентативно
для человека средних лет, хотя первое намного более вероятно. И з этого
примера следует, что увеличение определенности вообще не ведет к умень­
шению репрезентативности. Следовательно, сравнение событий, которые
отличаю тся по степени точности, часто создает конф ликт между репрезен­
тативностью и вероятностью . Н апример, случайная вы борка из четырех
карт, состоящ их из короля червей, туза пик, девятки бубен и четверки треф,
каж ется более репрезентативной, чем вы борка, состоящ ая из четы рех карт
одной масти, хотя последняя гораздо 5олее вероятна. Таким образом, пре­
дубеждения репрезентативности в суж дениях вероятности долж ны быть
наиболее очевидными в оценке событий, которые являю тся репрезентатив­
ными, но крайне специфическими. Такие предубеждения представлены в
исследованиях оценок вероятности слож ны х событий, описанных в следу­
ющей главе.

Об о ц ен к е сл о ж н ы х со б ы ти й
Существенное различие между вероятностью и репрезентативностью воз­
никает при оценке слож ны х событий. П редположим, что нам дали некото­
рую информацию о человеке (например, краткое описание личности) и что
мы размы ш ляем о различны х признаках или комбинациях признаков, ко­
торыми этот человек мож ет обладать: род занятий, склонности или полити­
ческие симпатии. Один из основных законов вероятности гласит, что деталь­
ность может только понизить вероятность. Таким образом, вероятность того,
что данный человек является и республиканцем и художником одновремен­
но, долж на быть меньш е, чем вероятность того, что человек является ху­
дожником. Это условие основано не только на стандартном исчислении ве­
роятности, но такж е и на ненормативных моделях (например, S hafer, 1976;
Zadeh, 1978).
Однако, требование, что Р(А и В) < Р(В), которое можно назы вать прави­
лом конъю нкции, не относится к подобию или репрезентативности. Синий
112 РЕПРЕЗЕНТАТИВНОСТЬ
квадрат, например, мож ет быть более подобен синему кругу, чем просто
кругу, и человек может походить на наш образ республиканца и художни­
к а больш е, чем на наш образ республиканца. П оскольку подобие объекта
цели мож ет быть увеличено, если добавить к цели особенности, которыми
обладает и объект (см. Tversky, 1977), подобие или репрезентативность мо­
гут быть увеличены путем специф икации цели. Если оценки вероятности
опосредованы репрезентативностью или подобием, то возможно строить за­
дачи, где соединение исходов окаж ется более репрезентативным и, следо­
вательно, более вероятным, чем один из его компонентов.

Эффект конъюнкции: исследование 1


Этот способ прогнозирования был впервые исследован в эксперименте, про­
веденном в И ерусалиме в 1974. Мы раздали 184 испытуемым четыре крат­
ки х описания личности. Каждое описание соответствовало стереотипу от­
дельно взятой профессии (например, водитель такси) и резко отличалось от
стереотипа отдельно взятой политической партии (например, лейбористы),
или наоборот. Следовательно, каж дое описание (X) было репрезентативно
по отношению к одной цели, обозначенной А, и нетипичным для другой
цели, обозначенной В. Каждое описание сопровождалось списком из пяти
или ш ести целевы х событий: занятие, политические симпатии или конъ­
ю нкцией событий, например, водитель такси, которы й является членом
партии лейбористов. Д ля каж дого описания, половина испытуемых полу­
чила список, где была к ак цель А, так и цель В, в то время к ак другая поло­
вина получила список, вклю чаю щ ий сложную цель (А и В). Оставшиеся
четы ре цели были идентичны в двух списках. Половину испытуемых по­
просили оценить цели согласно «степени, в которой X репрезентативен по
отношению к соответствующему классу», а другая половина оценивала их
согласно «вероятности того, что X является элементом соответствующего
класса».
С труктура исследован ия п озволи ла провести косвенное сравнение
репрезентативности и вероятности для события В и сложного события (А и
В) относительно четы рех постоянных альтернатив. Бы ли получены следу­
ющ ие результаты . Во-первых, было оценено, что все четы ре описания более
репрезентативны по отношению к сложной цели (А и В), чем только к цели
В. Во-вторых, упорядочение репрезентативности и вероятности каж дого
набора целей было почти идентично во всех случаях; средняя корреляция
меж ду средними значениями бы ла 0.96. В частности, сложной цели (А и В)
было приписано значительно более высокое среднее значение в упорядоче­
нии вероятности, чем простой цели В. Очевидно, уверенность в эвристике
репрезентативности привела к тому, что испытуемые оценивали конъю нк­
тивное событие к ак более вероятное, чем один из его компонентов, вопреки
правилу конъю нкции в теории вероятности. Назовем этот вид оценок эф­
фектом конъю нкции.
Оценки репрезентативности и на основе... 113
И сследование 2: Б и л л и Л инда
П оскольку стимульный м атериал, используемый в ранних исследованиях,
был крайне специфичен для израильской культуры , мы построили англий­
скую версию задач и провели аналогичное исследование с несколькими су­
щественными изменениями. Во-первых, мы сравнили результаты межгруп­
пового плана (в котором каж ды й испытуемый сравнивал либо сложную цель
(А и В), либо простую цель В с тем ж е самым набором альтернатив) с резуль­
татами внутригруппового плана, в котором каж ды й респондент сравнивал
непосредственно две критических цели. Мы выдвинули гипотезу, что пра­
вило конъю нкции не действует в первом упомянутом исследовании, к ак в
нашем исследовании, но мы ож идали, что частота наруш ений значительно
уменьш ится в последнем проекте, где участников просили сравнить Р(А) с
Р(А и В). Во-вторых, мы ож идали, что даж е ограниченный опыт испытуе­
мых в области статистики не допустит многих наруш ений правила конъ­
ю нкции, по крайней мере, при внутригрупповом плане.
Чтобы исследовать эти гипотезы, мы провели прямое и косвенное исследо­
вание с тем ж е самым стимульным материалом. Аналогичные исследования
были проведены в трех группах испытуемых, которые обладали различным
опытом в области статистики. П ервая группа испытуемых состояла из сту­
дентов старш их курсов Университета Британской Колумбии и Стэндфордс-
кого университета, не обладающих подготовкой в теории вероятности или
статистике. Промежуточная группа состояла из аспирантов в области психо­
логии и педагогики и студентов-медиков из Стэндфордского университета,
которые прошли курсы по статистике и были ознакомлены с основными кон­
цепциями теории вероятности. Третья группа состояла из аспирантов в обла­
сти принятия решений Бизнес-ш колы Стэнфорда, каж ды й из которых про­
шел курсы повышенной сложности по теории вероятности и статистике.
Бы ли составлены два кратких описания личности. Каждому участнику
был предоставлен один из этих набросков при прямом исследовании, а дру­
гой при косвенном исследовании. В первом тесте, описание личности сопро­
вождалось восьмью возможными исходами, вклю чая репрезентативны й
исход, нерепрезентативный исход и конъю нкцию этих двух. При косвен­
ном исследовании список исходов вклю чал либо два отдельных критичес­
ких исхода, либо их конъю нкцию . Образец для этих двух задач при прямом
исследовании приведен ниж е. Ч исла в круглы х скобках — средние значе­
ния, приписанные испытуемыми различны м исходам.
Биллу 34 года. Он умен, но лишен воображения, обязателен, но в общем скучный. В
школе он был силен в математике, но слаб в общественных и гуманитарных дисципли­
нах.
Пожалуйста, упорядочите следующие утверждения по их вероятности, присвоив наи­
более вероятному утверждению 1 и наименее вероятному 8.
(4.1) Билл — терапевт, хобби которого — игра в покер.
(4.8) Билл — архитектор.
114 РЕПРЕЗЕНТАТИВНОСТЬ
(1.1) Билл — бухгалтер. (А)
(6.2) Хобби Билла — играть дж аз. (J)
(5.7) Хобби Билла — серфинг.
(5.3) Билл — репортер.
(3.6) Билл — бухгалтер, хобби которого — играть дж аз. (A&J)
(5.4) Хобби Билла — альпинизм.

Линде 31 год, не замужем, искренняя и очень яркая натура. Она увлекается философи­
ей. Будучи студенткой, интересовалась проблемами дискриминации и правосудия, а
такж е участвовала в антиядерных демонстрациях.

П ожалуйста, упорядочите следующие утверждения по их вероятности, присвоив наи­


более вероятному утверждению 1 и наименее вероятному 8.
(5.2) Линда — преподаватель в начальной школе.
(3.3) Линда работает в книжном магазине и занимается йогой.
(2.1) Линда — активист феминистского движения. (F)
(3.1) Линда — психиатр.
(5.4) Линды — член Лиги женщин-избирателей.
(6.2) Линды — кассир в банке. (Т)
(6.4) Линды — страховой агент.
(4.1) Линда — кассир в банке и активист феминистского движения. (T&F)

К ак читатель, вероятно, догадался, описание Билла было построено таким


образом, чтобы быть репрезентативным по отношению к бухгалтеру (А) и
нетипичны м по отношению к человеку, чье хобби — дж аз (J). Описание
Линды было построено таким образом, чтобы быть репрезентативным по от­
ношению к активной феминистке (F) и нетипичным для кассира в банке
(Т). В соответствии с психологическим и принципам и подобия (Tversky,
1977), мы ож идали, что вероятности слож ны х целей, такие как бухгалтер,
которы й играет дж аз (В&J ) и кассир в банке, являю щ аяся активисткой ф е­
министского движ ения (T&F), попадали бы между вероятностями соответ­
ствую щ их простых целей.
Чтобы проверить этот прогноз, мы попросили первую группу из 88 ис­
пы туемых, упорядочить эти восемь целей «по степени, в которой Билл (Лин­
да) подобен типичному элементу соответствующего класса». Распределения
подобия подтвердили наш и гипотезы относительно описаний. Д оля испы ­
туемы х, которые показали прогнозированный порядок для Билла (А > А и
J > J ), составила 87% ; процент испы туемы х, показавш их прогнозирован­
ны й порядок для Линды (F > Т и F> Т), был 85% .
Все участники получили описание либо Билла, либо Линды в форме, со­
ставленной для внутригруппового плана, и упорядочили эти восемь целей
согласно их вероятностям. Полученные данные приведены в верхней части
Таблицы 1, где в строке «эффект конъю нкции (% )» приведен процент ис­
пы туемы х в каж дой группе, которые оценили сложную цель к ак более реп­
резентативную , чем простую цель. Строки “А и В” и “В” представляю т, со­
ответственно, средние ранги, приписанные сложной и менее репрезентатив­
ной простой целям . Средний ранг подобия и средний ранг вероятности при
внутригрупповом плане отраж ены на Рисунке 1.
Оценки репрезентативности и на основе... 115
Таблица 1. Эффект конъюнкции.

Группа 1 Группа 2 Группа 3


"Наивные Испытуемые с Опытные в
it
испытуемые' промежуточными области
знаниями в области статистики
статистики испытуемые

Линда Билл Линда Билл Линда Билл


Внутригрупповой
план

Эф ф ект конъю нкции


89 92 90 86 85 83
(% )
Средний ранг: А и В 4.2 3.6 3.9 3.5 4.0 3.4

Средний р а н г В 6.3 6.4 6.2 6.4 6.1 5.6

N 88 94 53 56 32 32

М ежгрупповой
план

Средний р а н г А и В 3.3 2.3 2.9 2.4 3.1 2.5

Средний ранг. В 4.4 4.5 3.9 4.2 4.3 4.6

N 86 88 55 56 32 32

П ри межгрупповом плане, две версии каж дой проблемы были построе­


ны путем удаления из списка либо сложной цели, либо двух простых целей.
Краткое описание личности, указания и оставш иеся пять целей были точно
таким и ж е, к ак для внутригруппового плана. Результаты опроса по м еж ­
групповому плану для всех групп испы туемы х представлены в ниж ней
части Таблицы 1.
Результаты , сведенные в Таблицу 1, показы ваю т, что слож ная цель была
оценена к а к более вероятная, чем простая критическая цель, к ак в проекте
1, так и 2. Этот результат, сохраняется к ак для двух описаний, так и для
всех групп. К наш ему удивлению , опыт в статистике имел незначительное
влияние н а эффект конъю нкции, что показали более чем 80% испытуемых
во всех трех группах.
В предыдущ их исследованиях критические цели были представлены в
большем количестве возможных исходов, которые могли скры ть отнош е­
ние вклю чения между ними. Поэтому интересно вы яснить, наруш аю т ли
люди правило конъю нкции даже тогда, когда логическое соотношение меж ­
ду целям и довольно очевидно. Чтобы проверить эту гипотезу, мы предоста­
вили новой группе испытуемых (не имею щ их опыта в области статистики)
описания Б илла и Линды. Каждому испытуемому было дано одно из двух
116 РЕПРЕЗЕНТАТИВНОСТЬ

Рис. 1 График средних оценок для восьми результатов, оцененных


по вероятности и по подобию для двух описаний.

описаний, и его спросили, к а к а я из двух критических целей (то есть, J и (А


и J ), или Т и (Т и F)) более вероятна. Эта процедура не уменьш ила эффект
конъю нкции: в случае Билла слож ная цель была выбрана 92% испытуе­
мы х (N = 88) и 87% испытуемых (N = 86) в случае Линды.
Общее игнорирование правила конъю нкции ставит перед нами интри­
гую щ ий вопрос относительно его нормативной достоверности. Чтобы ис­
следовать этот вопрос, мы опросили 36 аспирантов промежуточной груп­
пы , которы е участвовали в эксперименте. Их спросили, (1) к ак они упоря­
дочили две критических категории, (2) почему они так сделали, и (3) рас­
смотреть утверж дение, что “вероятность того, что Билл одновременно яв ­
ляется бухгалтером и играет дж аз, не мож ет превы ш ать вероятности того,
что он играет дж аз, потому что каж ды й член первой категории — всегда
является членом последней”. Больш е чем две трети испытуемых (1) сказа­
ли, что они выбрали сложную цель, (2) дали некую версию аргумента подо­
бия или типичности как причины и (3) согласились, после некоторого раз­
м ы ш ления, что их ответ был неправильны м, потому что он расходиться с
правилом конъю нкции. Только двое испытуемых утверж дали, что упоря­
дочение вероятности не должно согласовываться с принадлежностью клас­
су, и только один сказал, что он не так понял вопрос. Х отя опрос, склонил
испы туемы х в пользу правила конъю нкции, результаты показы ваю т, что
испытуемые третьей группы (с опытом в области статистики), по крайней
мере, расцениваю т наруш ение этого правила к ак печальную ошибку.
И нтерпретируя невыполнение правила конъю нкции, важ но рассмот­
реть, относится ли эффект, полностью либо частично, к лингвистическим
конвенциям или диалоговым правилам. Н апример, в раннем исследовании
мы предоставили людям следующее описание, “Джон — 27 лет, является
неординарной личностью. В колледж е он был выдаю щ имся атлетом, но не
Оценки репрезентативности и на основе... 117
демонстрировал способностей или интереса к интеллектуальным вопросам”.
Мы обнаружили, что Джон, по оценкам испытуемых, более вероятно, я в ­
ляется “преподавателем гим настики”, чем просто “преподавателем”. Хотя
каж ды й преподаватель гимнастики, в некотором смысле, преподаватель,
можно поспорить, что термин преподаватель понимается здесь в смысле,
который исклю чает значение преподавателя гимнастики или инструктора
автош колы. При таком планировании этой проблемы удалось избеж ать,
определив критический исход экстенсивно к ак пересечение двух множеств,
например, бухгалтеров и дж азовы х музыкантов-лю бителей.
Н аруш ения правила конъю нкции такж е наблюдаются и в задачах на
последовательность, где цель состоит из последовательности событий. Сло-
вик, Ф иш хофф и Лихтенш тейн (Slovic, Fischhoff, L ichtenstein, 1976) пре­
доставили испытуемым краткое описание личности человека, подходящ е­
го под стереотип инж енера, а не ж урналиста. И х испытуемые приписали
более низкую вероятность тому, что “Том В. выберет ж урналистику к ак ос­
новную специальность в колледж е”, чем тому, что “Том В. выберет ж урна­
листику к ак основную специальность в колледж е, но скоро разочаруется в
своем выборе и переклю чится на технические науки”. Строго говоря, пер­
вый случай вклю чает последний, и выш еупомянутое суждение наруш ает
правило конъю нкции. Однако относительно этого примера можно возразить,
что, согласно нормативным правилам разговора, утверждение, что Том В.
выбрал ж урналистику к ак основную специальность в колледж е, подразу­
мевает, что он такж е остался на этой специальности. И наче, это утверж де­
ние ввело бы в заблуждение.
Подобные возраж ения могут такж е возникнуть относительно примеров
Билла и Линды. Таким образом, можно поспорить, что испытуемые счита­
ют, например, категорию “кассир в банке” к ак “кассир в банке, не прини­
маю щ ая участия в феминистском движ ении” в отличие от данной катего­
рии “кассир в банке, которая является активисткой в феминистском дви­
ж ении”. Однако, наличие эф ф екта конъю нкции при межгрупповом плане,
в котором критические цели не сравниваю тся непосредственно, указы вает,
что этот эффект нельзя адекватно объяснить в терминах переформулиров­
ки категорий цели, согласно стандартны м диалоговым импликативны м
формам. Скорее, наблюдаемые оценки показы ваю т общую тенденцию оце­
нивать вероятности соответствующих событий степенью, в которой Линда
репрезентативна по отношению к типичным или прототипичным членам
соответствующих категорий.
Кроме того, мы наблюдали эффект конъю нкции в нескольких задачах, в
которы х, отсутствовали диалоговые импликативны е формы. Следующие
задачи, например, касаю тся прогнозирования будущих событий, где интер­
претация В к ак (В и “не А ”) каж ется невероятной.
118 РЕПРЕЗЕНТАТИВНОСТЬ
И сследование 3: П р о гн о зы н а 1 9 8 1 г.
Задачи, описанные в этой главе, были предназначены для того, чтобы про­
верить правило конъю нкции в прогнозировании событий реальной ж изни,
где испытуемые полагаю тся на свои общие знания. В исследовании этой
проблемы в декабре 1980 приним ала участие группа из 93 испытуемых,
которы е не имели опы та в области статистики. Группа получила следую­
щ ие инструкции.
В этом анкетном опросе Вас просят оценить вероятность различных событий, которые
могут произойти в течение 1981 г. Каждая задача включает четыре возможных собы­
тия. Ваша задача состоит в том, чтобы упорядочить эти события по вероятности, при­
своив 1 наиболее вероятному событию, 2 — второму, 3 — третьему и 4 — наименее веро­
ятному событию.

А нкетны й опрос вклю чал ш есть вопросов. Д ва вопроса приведены ниж е.


Результаты остальны х вопросов оказались подобными. Ч исла в круглы х
скобках показы ваю т средние оценки для каж дого случая; мы такж е приво­
дим процент испы туемы х, которые оценили сложную цель к ак более веро­
ятную , чем простую.
Теннис в 1981 г. (эффект конъюнкции: 72% )
П редположим, что Бьёрн Борг дойдет до финала в Уимблдоне в 1981. Пожалуйста, упо­
рядочьте следующ ие результаты от наиболее до наименее вероятного.
(1.7) Борг выиграет матч.
(2.7) Борг проиграет в первом сете.
(3.5) Борг выиграет в первом сете, но проиграет матч.
(2.2) Борг проиграет в первом сете, но выиграет матч.

Политика США в 1981 г. (эффект конъюнкции: 68% )


П ожалуйста, упорядочьте следующие события по вероятности того, что они произой­
дут в 1981.
(1.5) Рейган сократит федеральную поддержку местным органам власти.
(3.3) Рейган обеспечит федеральную поддержку матерям-одиночкам.
(2.7) Рейган увеличит бюджет на оборону меньше, чем на 5%.
(2.9) Рейган обеспечит федеральную поддержку матерям-одиночкам и сократит
федеральную поддержку местным органам власти.

К ак и в предш ествующ их исследованиях, слож ная категория была оце­


нена к ак более вероятная, чем один из ее компонентов. Результат совмес­
тим с понятием репрезентативности, которая скорее касается в этом случае
соотнош ения между причинно-следственной системой и ее исходами, чем
подобия описания стереотипу. Во второй задаче, например, каж ется нети­
пичны м для президента Рейгана, обеспечить федеральную поддерж ку м а­
терям-одиночкам и весьма репрезентативным для него сократить федераль­
ную поддерж ку для местных органов власти. К онъю нкция этих действий
оказы вается промежуточной по репрезентативности, а оценки вероятнос­
ти, очевидно, следуют тому ж е образцу.
Оценки репрезентативности и на основе... 119
В первой задаче большинство испытуемых оценили победу Борга на чем­
пионате к ак наиболее вероятное событие, а проигрыш Борга в первом сете
как менее вероятное. К онъю нкция этих двух событий, а именно проигрыш
Борга в первом сете, но победа в матче, оценивалась к ак менее вероятная,
чем первая возможность, но более вероятная, чем вторая. Очевидно, испы ­
туемые объединяли события скорее согласно принципам репрезентативно­
сти или причинно-следственного воздействия, чем согласно законам веро­
ятности.

Обсуждение
Результаты , о которых сообщалось в предыдущ их исследованиях, прямо
подтверждают гипотезу, что люди оцениваю т вероятность событий по сте­
пени, в которой эти события репрезентативны по отношению к соответству­
ющей модели или процессу. П оскольку репрезентативность события мо­
ж ет быть увеличена за счет уточнения, слож ная цель может быть оценена
как более вероятная, чем один из ее компонентов. Этот прогноз был подтвер­
жден исследованиями, использую щ ими к ак внутригрупповой, так и м еж ­
групповой план для совокупности испытуемых с различны м уровнем под­
готовки в области статистики.
В отличие от других правил вероятности, таких к ак регресс к среднему,
который труден для понимания испытуемыми с отсутствием опы та в облас­
ти статистики, правило конъю нкции является и простым, и легко приме­
нимым. Больш инство испытуемых проявило ж елание подтвердить его в аб­
страктной форме, хотя почти все они наруш или его на практике, когда оно
находилось в противоречии с интуицией репрезентативности. Полученные
результаты противоречат выводам Johnson-L aird и W ason (1977) относитель­
но проверки утверждений “если то” (см. такж е Johnson-L aird, Legrenzi и
Sonino-Legrenzi, 1972). Эти исследователи обнаружили, что большинство
испытуемых потерпело неудачу в заданиях с абстрактным материалом, а
не в конкретны х примерах. С другой стороны, наш и испытуемые подтвер­
дили правило конъю нкции в абстрактной форме, но наруш или его в конк­
ретных примерах (см. Главу 34).
Вывод о том, что конъю нкция часто каж ется более вероятной, чем один
из ее компонентов, может иметь далеко идущ ие последствия. Н ет причин
полагать, что суж дения политических аналитиков, присяж ны х заседате­
лей, судей и врачей независимы от эффекта конъю нкции. Этот эффект, ве­
роятно, особенно негативно проявит себя при попы тках дать прогноз отно­
сительно будущего, оценивая вероятности отдельно взяты х сценариев. Слов­
но смотря в хрустальны й ш ар, политические деятели, футурологи, а такж е
обыватели ищ ут образ того будущего, которое лучш е всего представляет их
модель развития настоящ его. Этот поиск ведет к построению детальны х
сценариев, которы е являю тся внутренне последовательны ми и вы соко
репрезентативны ми по отношению к наш ей модели мира. Такие сценарии
120 РЕПРЕЗЕНТАТИВНОСТЬ
часто оказы ваю тся менее вероятными, чем менее детальные прогнозы, ко­
торые ф актически являю тся более вероятными. С увеличением детализа­
ции сценария, его вероятность мож ет только устойчиво уменьш аться, но
его репрезентативность, и, следовательно, его очевидная вероятность, мо­
ж ет увеличиваться. Уверенность в репрезентативности, по наш ему мнению,
является первичной причиной безосновательного предпочтения детальных
сценариев и иллюзорного смысла интуиции, который часто обеспечивают
такие конструкции.
П утаница между суждениями вероятности и подобия имеет место не толь­
ко при прогнозировании неопределенного будущего, но такж е и при рекон­
струкции неопределенного прошлого, например, в истории или крим иналь­
ны х расследованиях. Здесь такж е, перечень прош лы х событий часто объе­
диняется в репрезентативный сценарий, который вклю чает вероятные пред­
полож ения относительно неизвестных событий. Включение таких предпо­
лож ений может только уменьш ать вероятность того, что полный перечень
событий является истинным, но это обеспечивает ощущ ение репрезентатив­
ности и последовательности, которое мож ет увеличивать каж ущ ую ся веро­
ятность сценария. Например, гипотеза “обвиняемый покинул место преступ­
лен и я” мож ет казаться менее вероятной, чем гипотеза “обвиняемый, поки­
нул место преступления из страха быть обвинённым в убийстве”, хотя пос­
леднее менее вероятно, чем первое. Хороший рассказ часто менее вероятен,
чем посредственный.
Н аконец, важ но понять, что эффект конъю нкции — это признак более
фундаментальной проблемы. Он просто обнаруживает несогласованность
меж ду логикой вероятности и логикой репрезентативности, которая часто
обусловливает мнения людей относительно неопределенных событий. Так
к ак суждение человека неотделимо от реш ения волную щ их проблем наш ей
ж и зни , конф ликт между интуитивной концепцией вероятности и логичес­
кой структурой этой концепции настоятельно требует разреш ения. С одной
стороны, мы не можем с готовностью отказаться от эвристики, которую мы
используем, для оценки неопределенности, потому что многое из наш их
знаний о мире связано к ней. С другой стороны, мы не можем бросить вызов
законам вероятности, потому что они определяют важ ны е истины нашего
мира. Н равится вам это или нет, А не может быть менее вероятно чем (А и
В), и уверенность в противоположном — ошибочна. Н аш а задача состоит в
том, чтобы сохранить всё полезное и эффективное в интуитивном суждении
при исправлении ошибок и предубеждений, к которым оно склонно.
Часть III
Причинность и
атрибуция
7. Общепринятое положение: информация не
обязательно информативна*

Ричард Е. Нисбетт, Юджин Борджида, Рик


Крендалл, Харви Рид

К огнитивная теория, которая в настоящ ее время оказы вает самое большое


влияние на социопсихологов — это теория атрибуции, формализованная
версия которой бы ла представлена Гарольдом Келли (H arold Kelley) в 1967.
Теория формулирует представление человека к ак ученого-лю бителя, кото­
рый делает попы тку вью ести причины явлений, которы е он наблюдает.
Причины, которы е он приписывает, определяют взгляд на его социальный
мир, а эта точка зрения может определять его поведение. Чрезвычайно ш и­
рокий диапазон явлений, начиная от исследования соответствия А ш а (Asch)
и заканчивая работой Ш ахтера (Schächter), посвящ енной эмоциям, может
быть описан к ак частный случай процесса каузальной атрибуции в действии.
Ф актически, каж ется вполне возможным, что наиболее важ ны м вкладом
Келли м ож ет, в конечном счете, считаться создание язы ка или карты до­
рог, с помощью которой можно описывать и искать взаимосвязи между раз­
нообразными социально-психологическими явлениями.
В дополнение к своему содействию организации, Келли установил три
формальных источника влияния на процесс каузальной атрибуции. В по­
пытке приписать причины событиям типа “Человек реагирует способом X
на ситуацию А ”, исполнитель реагирует на три источника информации:
отличительность информации (человек реагирует способом X во всех си­
туациях общего типа или только в ситуации А?); постоянство информа­
ции (человек реагирует способом X всегда, при ш ироком разнообразии об­
стоятельств или он реагирует способом X только иногда?); и согласованность
информации (большинство людей реагирует способом X или реакция яв л я­
ется нехарактерной). П риписывание причины будет зависеть от ответов на
каж ды й из этих вопросов. Таким образом, человек считается первичной

'Это сокращенная версия книги, которая появилась в редакции J. S. Carroll и J. W. Payne.,


Познание и социальное поведение. Hillsdale, N.J.: Lawrence Erlbaum Assoc., Inc, 1976. Пе­
реиздано в соответствии с разрешением.
124 ПРИЧИННОСТЬ И АТРИБУЦИЯ
причиной своей реакции настолько, насколько он реагирует подобным об­
разом во всех ситуациях общего типа и настолько, насколько его реакции
не демонстрирую тся другими.
Ситуация считается причиной настолько, насколько реакция человека
уникальна по отношению к ситуации А и настолько, насколько его реакция
типична.
А нализ процесса приписывания, проделанный Келли, к ак одобрялся, так
и критиковался на том основании, что он банален. Нравится или нет это каче­
ство теории, к удивлению обнаруживается, что одна из ее фундаментальных
аксиом не наш ла фактически никакого подтверждения в последующем ис­
следовании. Это положение о том, что люди отвечают на согласованность ин­
формации посредством локализации причины. Несмотря на теорию и здра­
вый смысл, доказано,что знание поведения других людей мало влияет на при­
писывание причин. Знание того, что реакция человека глубоко типична, к а­
ж ется, не приводит к выводу, что, скорее ситуация, чем исполнитель, явля­
ется главным причинным фактором. И наоборот, знание того, что реакция
человека является уникальной, не приводит к выводу, что скорее исполни­
тель, чем ситуация является главным причинным фактором.
Н иж е мы рассматриваем доказательство того, что точка зрения, согласно
которой люди используют согласованность информации при создании при­
писываний, не пользуется особой поддержкой. Это доказательство касается
и случаев, где исполнителем является другой человек, а такж е случаев, взя­
тых прежде всего из нашего собственного исследования, где исполнитель —
это сам человек. Затем мы демонстрируем сходство между неспособностью
согласованности информации повлиять на приписывание и доказательством
Канемана и Тверского (1973,4) того, что информация о базовом значении не в
состоянии повлиять на прогнозы. Мы предлагаем объяснения двух неудач в
терминах относительного влияния абстрактной (согласованность, базовое
значение) информации против конкретной (исполнителя или связанной с
целью) информации. Наконец, мы используем различие между абстрактной
и конкретной информацией при вопросах общения и убеждения.

С о гл ас о в а н н о с ть и н ф о р м а ц и и и в о с п р и я т и е д р у ги х л ю д ей
Существуют два исследования, которые изучаю т влияние согласованности
информации на предсказание поведения других людей. Оба исследования
показы ваю т заметную слабость согласованности инф ормации. Первое из
них — исследование Л .З . М акАртур (L.Z.M cA rthur) (1972). Ее исследова­
нием было прямое тестирование предположений Келли относительно эффек­
тов влияни я отличительности, постоянства и согласованности на каузаль­
ную атрибуцию. Испытуемым давали короткие описания типа “человек ре­
агирует на стимул способом X ” и дополнительно давалась информация по
величинам относительно отличительности, постоянства и согласованности.
Н апример, испытуемым могли сказать: “Во время танца Ральф наступал на
Общепринятое положение... 125
ноги Д ж оан”, и не указать дополнительно, что Ральф наступает на ноги по­
чти всех девуш ек (или не наступает на ноги девуш кам), или что Ральф по­
чти всегда (или никогда не) наступает н а ноги Д ж оан, и что почти все (или
никто) не наступаю т на ноги Джоан. Затем испытуемых спросили, являлся
ли случай наступания на ноги ошибкой Ральф а, ошибкой Джоан или вино­
ваты обстоятельства. Испытуемых такж е попросили предсказать обобще­
ние реакции (насколько вероятно, что Ральф должен посоветовать Джоан
записаться в танцевальны й клуб?) и обобщения стимула (насколько веро­
ятно, что Ральф наступал н а ноги на ледяном тротуаре?).
Отличительность информация составила 10% разницы в причинно-след­
ственном приписывании (подводящем итог по всем причинам) и 63% раз­
ницы в ож иданиях относительно обобщения стимула. Постоянство инфор­
мации составило 20% разницы в причинно-следственных приписы ваниях
и 14% разницы в ож иданиях относительно обобщения реакции. Н апротив,
согласованность информации Составила меньше 3% разницы в любом из
трех видов вывода. Эти результаты наруш аю т не только здравы й смысл те­
ории приписы вания, но и здравый смысл вообще. Х отя испытуемые пола­
гают, что важ но знать, наступает ли Ральф на ноги большинству девуш ек и
наступает ли он обычно на ноги Д ж оан, для них совершенно не важ но, на­
ступают ли на ноги Джоан другие люди!
Здравый смысл приписы вания или любой другой его разновидности так ­
же наруш ается в другом исследовании, касаю щ имся восприятия других
людей. М иллер, Гиллен, Ш енкери Редлав (M iller, G illen, Schenker, Radlove,
1973) попросили студентов колледж а прочитать раздел классического ис­
следования М илграма (M ilgram , 1963), в котором изучается повиновение.
Половине испытуемых дали ф актические данные исследования М илграма,
показываю щ ие, что практически ко всем испытуемым был применён элек­
трошок значительной силы, а к большинству был применён электрош ок м ак­
симальной силы . Других ж е испытуемых уверили, что такое поведение бу­
дет редким. Затем всех испытуемых попросили оценить двух человек, к
которым был применён электрош ок максимальной силы . По 11 признакам
с большой нагрузкой на оценочный компонент, например, привлекатель­
ность, доброжелательность, агрессивность. Только на одну из этих 11 оце­
нок согласованность информации имела существенное влияние. Знание того,
что применения электрош ока максимальной силы было модальным пове­
дением, ф актически не повлияло на оценки людей, перенесш их максималь­
ный ш ок.

Согласованность информации и самовосприятие


Согласованность информации такж е имеет небольшое влияние на атрибу­
ции, сделанные относительно самого человека. Бем (Bern, 1967) предложил,
а Келли (K elley, 1967) ввел в теорию атрибуции понятие того, что люди про­
изводят причинно-следственный анализ своего собственного поведения в
126 ПРИЧИННОСТЬ И АТРИБУЦИЯ
полном соответствии с их приписыванием относительно поведения других
людей. Они наблюдают их реакцию , принимая во внимание ситуации, в
которы х она протекает, и делают выводы относительно их чувств и моти­
вов. Н апример, испытуемый в классическом эксперименте Ш ахтера и Зин­
гера (S chächter и Singer, 1962), который знает, что ему был введен препа­
рат, который возбуждает эмоции и затем смоделирована ситуация, вы зы ­
ваю щ ая сильны е эмоции, проводит своего рода причинно-следственный
анализ. Он чувствует признаки пробуждения эмоций, которые обычно он
мож ет приписать эмоциональному воздействию ситуации, но вместо этого
приписывает их препарату, который он принял. В результате он проявляет
в поведении меньш е признаков эмоций, чем испытуемые, которые не зна­
ли, что им был введен такой препарат, и даж е чем контрольная группа ис­
пы туемых, которым препарат, возбуждаю щ ий эмоции, не был введен вооб­
щ е. Значит, испытуемый воспринимает причину своих автономных реак­
ций к ак “внешнюю” по отношению к себе и ведет себя соответственно.
Н есколько лет назад, мы начали программу терапевтических вмеш а­
тельств, основанных на точке зрения, что людей можно заставить искать
причину их реакций во внеш ней среде. П редполагалось, что всякий раз,
когда человек реагирует неадекватно или патологически, можно добиться
определённого результата, убедив человека приписать его реакции чему-то
внеш нему по отношению к себе. Первое исследование, единственное успеш ­
ное, было проведено Стормсом и Нисбеттом (Storm s и N isbett, 1970). Иссле­
дуемой патологией бы ла бессонница. Мы попросили студентов, у которых
были проблемы с засыпанием, за 15 минут перед сном принимать пилюлю
(на самом деле «пустыш ку»), которая, к ак им сказали, ускоряла сердцеби­
ение, делала ды хание быстрым и нерегулярны м, обладала согревающим
эффектом и приводила тело в общее состояние тревожности. Это - конечно
признаки бессонницы. К ак оказалось, испытуемые, принимавш ие эти пи­
лю ли, к ак сообщалось, засыпали быстрее, в те ночи, когда они их принима­
ли, чем когда не принимали, и быстрее, чем контрольная группа испытуе­
м ы х, которые не принимали никаких пилю ль. Сторме и Нисбетт приш ли к
выводу, что один или оба процесса приписы вания могут объяснить резуль­
таты . Бессонница вы звана в значительной степени состоянием эмоциональ­
ного возбуждения в ночное время, за счет любого количества причин, вклю ­
ч ая беспокойство относительно личны х проблем, неудобного реж им а дня
или хронического невроза. П оскольку человек леж ит в кровати в состоя­
нии эмоционального возбуждения, его сон вклю чает мысли с эмоциональ­
ным содержанием. Эмоциональное возбуждение может связаться с эмоцио­
нальны м переж иванием и усиливать его. Результирующ ее усиленное эмо­
циональное состояние увеличивает эмоциональное возбуждение и так да­
лее, по замкнутому кругу. Однако этот круг может быть разорван, за счет
знания того, что возбуждение является внеш ним. В этом случае человек не
делал бы выводов относительно того, к ак он взволнован по поводу экзамена
или насколько сердит он был на соседа по комнате и из наблюдения собствен­
Общепринятое положение... 127
ного эмоционального состояния. В те ночи, когда человек принимает пилю ­
ли, эмоциональное возбуждение воспринимается неизбежным и, таким об­
разом, не связанны м с любыми мы слями в голове. Так к ак замкнутый круг
усиленного эмоционального возбуждения, таким образом, бы лразорван, сон
мог наступить.
А льтернативно, или дополнительно, мог бы действовать несколько дру­
гой процесс более общего плана. Н аш и страдающ ие бессонницей испытуе­
мые сообщили, что они были весьма обеспокоены тем фактом, что они стра­
дают бессонницей. Они воспринимали это как свидетельство более общей
патологии и к ак нечто, плохо отражаю щ ееся на состоянии психического
регулирования. Д ля испытуемого с такими переж иваниями, знание о неиз­
бежном, произведенном извне эмоциональном возбуждении должно оказать
благотворное влияние. Испытуемый мог бы рассуж дать, что, по крайней
мере, сегодня вечером бессонница не может считаться свидетельством об­
щей психопатологии. П оскольку подобное беспокойство частично являет­
ся причиной бессонницы, сон должен наступать быстрее в ночи, когда при­
менялись пилю ли.

П опы т ки управлят ь депрессией


Вооруженные этим успехом в ситуации со страдающ ими бессонницей, мы
начали попы тки изменений состояния депрессии. М етодикой во всех иссле­
дованиях бы ла м анипуляция согласованности, разработанная таким обра­
зом, чтобы перенести во внешнюю среду причину депрессивного аффекта,
убеж дая испы туемы х, что она ш ироко распространена. П оскольку это со­
стояние разделяется другими людьми, само присутствие влияет на челове­
ка менее отрицательно. Должно казаться, что это состояние не определяет
индивидуальны е, возможно патологические, реакции испытуемого на от­
дельно взяты е обстоятельства. С уменьш ением волнения и беспокойства
относительно способности испытуемого справляться с ж изненны ми ситуа­
циями, депрессия могла бы частично уменьш иться.
Исследование 1: Воскресная хандра. Многие студенты испытываю т общее
ухудш ения настроения по воскресеньям. Х отя день может начинаться дос­
таточно хорошо с поздним завтраком, кофе и воскресными газетами, ощу­
щение беспокойства часто начинается днем. Необходимо много сделать на
предстоящ ую неделю, слиш ком много, чтобы всерьёз подумать о воскрес­
ном пикнике, хотя не достаточно много, чтобы начать работу сию минуту. К
концу дня, оказы вается, что не было ни активного отды ха, ни работы, вос­
кресные газеты , причем возможно даж е разделы о финансах и путеш естви­
ях, были тщ ательно изучены , а впереди м аячит длинный вечер утомитель­
ной учебы. К вечеру, если все склады вается плохо, к ак это часто бывает,
работа идет с трудом, если идет вообще, и воцаряется хмурое настроение и
неуверенность в себе.
128 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Мы предполож или, что, если бы это явление было общераспространен­
ны м и люди знали об этом, интенсивность воскресной хандры могла бы
уменьш иться. Если бы отдельно взяты й студент знал, что комнаты в обще­
ж итии полны людей в том ж е состоянии, то его собственные отрицательные
эмоции долж ны быть несколько смягчены. Вместо того чтобы подумать, что
он не создан для студенческой ж изни или что у него никогда не будет серьез­
ны х отнош ений с ж енщ иной, он может просто сказать себе, что люди имеют
тенденцию грустить по воскресеньям и оставить это к ак есть.
Чтобы проверить это предположение, мы просили большое количество
студентов мужского пола старш их курсов в Йельском университете запол­
нить несколько ш кал настроения в 16:00 и 22:00 по воскресеньям. Ш кала­
ми настроения были несколько ш кал Вессмана и Рикса (W essm an и R icks,
1966), с большим акцентом на факторе повы ш ения-сниж ения настроения.
Кроме того, испытуемых попросили заполнить анкетны й лист в 22:00, от­
носительно их успеваемости и социальной активности в течение дня и ко­
личества случаев, в которы х они дали выход некоторому аффекту пониж е­
н и я настроения, например, когда они кричали или плакали. Н аконец, ис­
пытуемые брали стопку кассет с мультфильмами и оценивали их по забав­
ности.
После предварительны х измерений по воскресеньям испытуемые дели­
лись на три группы , по 18 испытуемых в каж дой. Одной группе, группе кон­
троля, просто говорилось, что исследователи изучали настроение по воскре­
сеньям, и участников просили в следующее воскресенье заполнить тот ж е
самый пакет материалов. Д ля другой группы, подробно был описан синд­
ром воскресной хандры , и испытуемым дали (ложную) статистику, чтобы
указать, насколько ш ироко она распространена среди студентов. Испытуе­
мым говорили, что 92 % студентов Йельского университета испы ты вали по­
добное явление по крайней мере иногда, в то время к ак 65% испы ты вали
его в больш инство воскресений. Третьей группе дали ту ж е самую согласо­
ванную информацию , как и второй группе, и, кроме того, дали теорию,
объясняю щ ую это явление. Испытуемым сказали, что оно вызвано “кру­
ш ением эмоционального возбуж дения” по воскресеньям: нормальное эмо­
циональное возбуждение буднего дня обычно сопровождается более высо­
ким эмоциональным возбуждением в субботу; и тогда в воскресенье, наблю­
дается его резкий упадок. Этот недостаток эмоционального возбуждения
часто интерпретируется как депрессия или преобразовывается в депрессию.
О жидалось, что испытуемые в последних двух экспериментальны х груп­
пах дадут иное толкование своим грустным переж иваниям в воскресенье,
менее приним ая их на свой счет и становясь менее подавленными по поводу
своей депрессии. Если это так, они долж ны были показать уменьш ение аф ­
ф екта пониж ения настроения по ш кале с первого воскресенья на следую­
щее; уменьш ение поведения, вызванного понижением настроения, такого
к ак вспы ш ки гнева или плача; увеличение успеваемости и социальной ак ­
тивности; и более высокую среднюю оценку забавности мультфильмов в те-
Общепринятое положение... 129
чение второго воскресенья. Но ничего подобного не произош ло. Настроение
испытуемых не улучш илось ни на один показатель по сравнению с испыту­
емыми контрольной группы.
Исследование 2: Хроническая депрессия. Не слиш ком разочарованные, мы
сделали попы тку подобного вмеш ательства со студентами муж ского пола
старш их курсов, которые описали себя к ак имеющ их хроническую депрес­
сию. Д вадцать испытуемых были привлечены посредством рекламы в сту­
денческой газете М ичиганского университета, которая призы вала “студен­
тов муж ского пола старш их курсов, страдаю щ их депрессией, участвовать в
исследовании депрессии Институтом социального исследования”.
По прибытии в лабораторию, испытуемых наугад разделили на две груп­
пы. Испытуемым из контрольной группы сказали, что разработали новую
ш калу настроения и что необходимо, используя ее, получать ежедневные
записи настроения людей, описываю щ их себя к ак страдаю щ их от депрес­
сии. Это помогло бы оценить валидность ш калы и ее способность обнаружи­
вать изменения настроения.
Испытуемым экспериментальной группы дали ту ж е самую информацию
и, кроме того, сказали, что экспериментаторы находились на заклю читель­
ной стадии испы тания теории депрессии на молодых лю дях мужского пола.
Теория, основанная на ф актах, по крайней мере, в частны х случаях, гласи­
ла следующее. Испытуемым сообщили, что в течение некоторого времени
известно, что изменения настроения у взрослых зависит частично от при­
сутствия гонадальны х гормонов - у муж чин от тестостерона. До недавнего
времени считалось парадоксальны м, однако, что дети почти никогда не ис­
пытывают депрессии. Так к ак дети имеют чрезвычайно низкий уровень всех
гонад альны х гормонов, это казалось противоречием общему правилу, что
гормоны вы зываю т хорошее настроение. Этот парадокс недавно был разре­
шен открытием, что лимбические доли, (эмоциональный центр мозга) в юно­
ш еские годы становится зависимым от гонадального гормона, который ре­
гулирует настроение. У большинства муж чин, переключение рассчитано та­
ким образом, чтобы соответствовать повышению уровня тестостерона, ко­
торый достигает пика приблизительно в 25 лет. У многих молодых людей,
однако, переклю чение заверш ается до того, к ак «топливо», если можно так
вы разиться, доступно в достаточных количествах, чтобы регулировать и з­
менения настроения.
Больш ое значение придавалось тому, что испытуемый и был таким мо­
лодым человеком. Ожидалось, что м анипуляция улучш ит настроение по
трем взаимосвязанны м причинам:
1. Д ля депрессии предполагалось временное ограничение.
2. Отрицательное влияние, было смещено «наружу» в смысле, что оно
теперь может быть приписано скорее неудачному биологическому ин­
циденту, чем течению собственной ж изни испытуемого и какой-либо
патологической неспособности справиться с этим.
130 ПРИЧИННОСТЬ И АТРИБУЦИЯ
3. О трицательный эффект и его причины наблюдались у многих дру­
гих людей, таким образом, подразумевая распространённость проблем
испытуемого и его реакции на них.
Всех испытуемых просили заполнять анкеты настроения Вессмана и Рикса
в конце каж дого дня в течение 2-недельного периода. А нкетны й опрос так­
ж е вклю чил сообщение о том, к ак испытуемый спал в предыдущую ночь,
потому что наруш ения сна — частые признаки депрессии. Н аконец, в кон­
це семестра, в котором проходило исследование, были получены средние
оценки успеваемости испытуемых.
Не имелось никаких различий в сообщениях о настроении испытуемых
в экспериментальной группе и в группе контроля в любом пункте в течение
2-недельного периода, такж е не было различий в сообщениях о качестве сна.
Не было ф актически и нам ека на какую -либо тенденцию в направлении ги ­
потезы по этим переменным. Испытуемые экспериментальной группы по­
лучили более высокие средние оценки, к ак и было спрогнозировано, но это
не имело статистической значимости (0.05 < р < 0.10)...

А трибуция и психология прогнозирования


Канеман и Тверски продемонстрировали логическую ош ибку, которая по­
хож а на ош ибку, наблюдаемую в исследовании эффектов согласованности
информации. В книге под названием “П сихология прогнозирования” (1973,
4) эти исследователи показали, что люди не принимаю т во внимание базо­
вое значение совокупности при прогнозировании категориальной принад­
леж ности целевого элемента совокупности...
Если на испытуемых не влияет информация базового значения в их про­
гнозах относительно принадлежности целевого события категории, тогда едва
ли вероятно, что на их приписывания, будет влиять согласованность инфор­
мации. Согласованность информации — это то ж е самое, что информация
базового значения. Это информация базового значения относительно скорее
поведенческих реакций, чем принадлежности категории. Приписывание,
кроме того, является более сложным и непрямым выводом, чем прогнозиро­
вание. Канеман и Тверски попросили испытуемых произвести довольно пря­
мую и несложную цепь вывода: «если большинство членов популяции при­
надлеж ат некой категории, то тоже самое можно сказать и о целевых испы ­
туемых». Их испытуемые были не в состоянии сделать такой вывод. В рас­
смотренном исследовании атрибуции, требуется еще более слож ная цепь вы ­
вода: «если большинство элементов совокупности ведут себя некоторым об­
разом, то ситуация должна оказы вать сильное давление на такое поведение,
и поэтому не стоит обращаться к личным отличительным особенностям, что­
бы объяснить поведение целевого испытуемого, если оно модально».
Остаётся проверить, не ж елаю т ли испытуемые применять поведенчес­
кие базовые значения к прогнозированию целевых случаев. Если нет, то
Общепринятое положение... 131
необходимый нам вопрос должен быть изменен от «почему люди не могут
изменять свои приписывания в соответствии с согласованной информаци­
ей» на более фундаментальный «почему люди обращ аются с информацией
базового значения, к ак будто она неинформативна».
Исследование 5: Поведенческие базовые значения, прогнозирование и ат­
рибуция. Чтобы исследовать вопрос о ж елании людей изменять свои про­
гнозы, если им дана поведенческая информация базового значения, испы ­
туемы м бы ли описаны два п сихологических эксперим ента (N isb ett и
Borgida, 1975). Студенты университета ш тата М ичиган прочитали деталь­
ные описания (а) эксперимента Нисбетта и Ш ахтера (1966), в котором ис­
пытуемых просили испы тать на себе электрош ок такой силы , какой они
могли перенести и (Ь) эксперимента Д арли и Л атане (D arley и Latane, 1968),
относительно оказания помощи, в котором во время того, к ак несколько
студентов обсуждали проблемы управления колледжем через науш ники в
отдельных кабинах, у одного из «испытуемых» начиналось что-то напоми­
нающее приступ. Эти два эксперимента были выбраны, потому что в наш ем
опыте обучения, предположения студентов коллед ж а относительно поведен­
ческого базового значения были известны. Несмотря на то, что студенты
склонны предполагать, что немногие испытуемые получат сильный элект­
рош ок, модальное поведение — это вытерпеть самый большой разряд, кото­
рый мож ет вы дать аппарат, то есть достаточный для того, чтобы заставить
всю руку испытуемого непреднамеренно дергаться. И хотя студенты пред­
полагаю т, что большинство людей быстро покинуло бы свои кабины , чтобы
помочь в ситуации приступа, типичный испытуемый никогда ничего не де­
лает, чтобы помочь ж ертве в опыте, проведенном Латаном и Дарли с шес­
тью испытуемыми.
П оскольку испытуемые не знали об истинных поведенческих основных
значениях, было возможно дать некоторым из испытуемых ф актическое
базовое значение этих двух экспериментов, и, таким образом, создать диф­
ференциальные условия базовой информации. Испытуемым со знанием ба­
зовой пропорции (условие согласованности информации) показали краткие
видеосъемки интервью со студентами, описанными к ак испытуемые в пер­
воначальны х экспериментах (или в одном варианте условия согласованно­
сти информации, испытуемым показали краткие письменные описания био­
графии и личности студентов). Затем испытуемых из группы согласованно­
сти информации попросили предсказать, к ак целевые субъекты, о которых
они просмотрели видеозапись или прочитали, вели бы себя. Поэтому мож ­
но сравнить прогнозы испытуемых группы согласованности информации,
как с ф актической информацией базового значения, которой они обладали,
так и с предположениями относительно базового значения, сделанными ис­
пытуемыми, при отсутствии согласованности информации.
Н а Рисунке 1 показаны результаты эксперимента с электрошоком. Верх­
н яя гистограмма показы вает ф актические данные базового значения, пре­
132 ПРИЧИННОСТЬ И АТРИБУЦИЯ
доставленные испытуемым из группы согласованности информации. Вто­
рая гистограмма даёт оценки базового значения, составленные испытуемы­
ми без знания базового значения. Очевидно, что оценки испытуемых этой
группы весьма отличаю тся от ф актических данных. Они приняли получе­
ние умеренного количества электрош ока к ак модальное поведение. Третья
гистограмма представляет предположения испытуемых группы согласован­
ности информации относительно поведения целевых субъектов, о которых
они просмотрели видеоматериал или прочитали. Х отя испытуемые были
полностью осведомлены о базовом значении, может быть замечено, что рас­
пределение даж е отдаленно не походит н а фактическое базовое значение.
Вместо этого, распределение подобно распределению базового значения,
сделанного группой испытуемых, без знания базового значения. Результа­
ты эксперимента об оказании помощи были полностью подобны.
Этот эксперимент дал возможность проверить другую гипотезу, предло­
женную Тверским и Канеманом (1971, 2) в статье под названием «Вера в
закон м алы х чисел», где эти авторы доказы вали, что даж е ученые уделяю т
мало вним ания размеру выборки и склонны делать необоснованные выво­
ды относительно совокупности исходя из знания о небольшом количестве
случаев. Чтобы проверить эту точку зрения в данном контексте, некоторым
испытуемым не сообщили о базовых значениях в обоих экспериментах и
показали им краткие видеоинтервью с двумя испытуемыми из каж дого эк ­
сперимента. Испытуемым со знанием целевой информации сказали, что
испытуемые в обоих экспериментах вели себя наиболее экстремальным об­
разом, то есть, что оба испытуемых в эксперименте с электрош оком приня­
ли максимально возможный удар током, и оба испытуемых в эксперименте
об оказании помощ и так и не помогли жертве. Затем испытуемых со знани­
ем целевой информации попросили указать, каково, по их мнению, будет
распределение всей совокупности испытуемых в экспериментах. В обоих
экспериментах, испытуемые были склонны сделать вывод, что образ дей­
ствий совокупности будет идентичен поведению двух испытуемых, которых
они видели. В ниж ней гистограмме на Рисунке 1 можно увидеть, что оцен­
ки базового значения в эксперименте с электрош оком были подобны истин­
ному базовому значению. Оценки не были настолько подобны для экспери­
мента с оказанием помощи, но они были довольно приближ ены к J -образ-
ной кривой базовой пропорции.
Испытуемые были склонны делать вывод, что образ действия совокуп­
ности был подобен поведению двух рассмотренных ими случаев, и когда
процедура формирования выборки была неопределенна, и когда их вним а­
ние неоднократно привлекалось к тому ф акту, что эти два случая были ото­
браны наугад из ш ляпы , содержащ ей имена всех испытуемых.
Подведем итог, испытуемые не использовали информацию базового зна­
чения, когда их попросили, сделать прогноз относительно поведения целе­
вы х субъектов. Важно заметить что, помимо вопросов прогнозирования,
было задано несколько вопросов по атрибуции, например, влияли ли обсто-
Общепринятое положение... 133

Эксперимент с электрошоком
Информация базового значения,
данная испытуемым при наличии
согласованности информации

Оценки базового значения, дан­


ные испытуемыми при отсутст­
вии согласованности информации

Прогнозы относительно целевых


(в) испытуемых, данные испытуемы­
ми при наличии согласованности
информации

Оценки базового значения, дан-


(F ) ные испытуемыми при наличии
целевой информации

1. Отказались или остановились после


применения стандартного разряда

2. Дошли до ощущения пощипыва­


ния в пальцах

3. Дошли до подергивания в руках

4. Дошли до судорожного подерги­


вания предплечья

5. Дошли до разряда, заставивше­


го всю руку подернуться

Рис. 1. Базовое значение, оценки базового значения и прогнозы о це­


левы х испытуемых в эксперименте с электрош оком.

ятельства или личны е склонности на поведение данного человека. Согласо­


ванность информации не имела существенного влияния на вопросы атри­
буции. П оследняя ош ибка каж ется ф актически неизбежной при наличии
предыдущ ей ош ибки. Поэтому, вопрос относительно того, почему люди дол­
ж ны игнорировать согласованность информации в создании атрибуций, дол­
ж ен быть сокращ ен до более фундаментального вопроса относительно того,
почему инф ормация базового значения долж на игнорироваться даж е для
такого простого вывода к ак прогнозирование. Любой ответ на этот фунда­
ментальны й вопрос относительно неспособности людей, извлечь информа­
цию из информации базового значения в идеале должен одновременно от­
носиться и к другому главному выводу в данном исследовании. Этот вывод
состоит в том, что испытуемые, в действительности, “чрезмерно” пресыщ е­
ны информацией целевого случая, они склонны принять то, что эсктремаль-
ное поведение является модальным, если говориться, что только два испы ­
туемых вели себя наиболее экстремальным способом.
134 ПРИЧИННОСТЬ И АТРИБУЦИЯ
А бстрактная инф орм ация против конкретной информации
К анеман и Тверски (1 9 7 3 ,4 ) не разм ы ш ляли о причинах того, почему лю­
дям не удается использовать информацию базового значения. И х основное
объяснение сосредотачивается на идее, что люди просто не очень хорошо
умеют обращ аться с вероятностными данными. Д аж е в сфере азартны х игр,
где люди имею т, по крайней мере, некоторое элементарное представление о
том, к а к обращ аться с вероятностями, они могут проявлять примечатель­
ную слепоту и предубеждения. Вне таких ситуаций люди могут быть абсо­
лютно не в состоянии увидеть необходимость такой “простой” вероятност­
ной информации к ак базовое значение. И ли, непонимание того, к ак долж ­
ным образом комбинировать информацию базового значения с информаци­
ей целевого случая, ведет к тому, что люди просто игнорирую т информа­
цию базового значения в целом.
И меется, конечно, значительная доля правды в точке зрения, что люди
не умеют работать с вероятностной информацией. Ф актически, сущ ествует
единственное исключение в литературе приписывания из правила, что люди
игнорирую т согласованность информации. Это — ясное свидетельство ис­
пользования базового значения успехов и неудач при создании приписы ва­
ний относительно способностей отдельно взятого человека (W einer и дру­
гие, 1971). Если большинство людей терпит неудачу в отдельно взятой зада­
че, то целью человека воспринимается приобретение больш их способнос­
тей; если люди преуспевают, то целью воспринимается приобретение более
н изких способностей. Конечно, на протяж ении всей ж изни мы приобрета­
ем опыт относительно поведения других людей. Способность, ф актически,
является по определению выводом, полученным из базового значения.
Н ам каж ется, однако, что может такж е действовать другой принцип. По
своей природе базовое значение или согласованность информации расплы в­
чата, незначительна и абстрактна. Н апротив, инф ормация целевого случая
яр к а, значительна и конкретна. В исследовании депрессии, мы делали по­
пы тку противопоставить воспоминания о довольно сухой, статистической
информации и ж ивую , настойчивую реакцию на стимулы реального мира.
В изучении дегустации крекера согласованность, абстрагированная от ин­
ф ормации об уровне ж идкости в буты лках, была противопоставлена чув­
ственному впечатлению . В исследовании с электрош оком и об оказании по­
мощ и, данные о частоте были противопоставлены видеосвидетельству или
письменному описанию реально существующего человека с родителями,
планам и относительно карьеры , увлечениями и индивидуальными особен­
ностями. Н есмотря на логическую уместность информации базового значе­
н и я, она всё-таки не будет значительной для продолж ения познавательного
процесса.
Эта гипотеза не нова. В 1927 году Бертран Рассел (B ertrand R ussell) пред­
полож ил, что «общ епринятая индукция зависит от эмоционального инте­
реса случаев, но не от их числа» (стр. 269). В экспериментах, проведенных
Общепринятое положение... 135
Канеманом и Тверски, а такж е в исследованиях, проведенных нами и дру­
гими относительно эффектов согласованности информации, простое пред­
ставление количества случаев было противопоставлено случаям эмоцио­
нального интереса. Согласуясь с гипотезой Рассела, эмоциональный инте­
рес в каж дом случае брал верх.
Мы предполагаем, что конкретная эмоционально интересная информа­
ция обладает большим потенциалом делать выводы из-за подобия «сцена­
риев», вы зываю щ их данную информацию , или схем, вовлекаю щ их подоб­
ную информацию . И вывод далее следует по хорошо изученным строкам
предыдущего сценария. А бстрактная информация менее богата потенци­
альными связям и с ассоциативной сетью, посредством которой можно дос­
тичь сценариев. В соответствии с этим предположением, Нисбетт и Боргида
(N isbett и B orgida, 1975) обнаружили, что согласованность информации от­
носительно поведения других людей в экспериментах с электрош оком и об
оказании помощ и, не только не повлияла на предсказание испытуемых о
том, к ак бы они себя вели, находясь в подобных условиях, но и не была ни
разу упомянута в последующем опросе, почему они сделали такие предска­
зания. Вместо этого испытуемые заострили внимание на определённых де­
талях экспериментальной ситуации и соотнесли их с похожими ситуация­
ми из своего жизненного опыта. «Уверен, я бы помог парню, потому что у
меня был друг, ч ья сестра болела эпилепсией».
Гипотеза Рассела имеет несколько вс ж ны х посылок к действию в повсед­
невной ж изни. В качестве иллю страции рассмотрим простой пример. Пред­
положим, Вам необходимо купить новую маш ину, и в целях экономии и
долговечности Вы реш или приобрести одну из таких солидных ш ведских
маш ин среднего класса, к ак Volvo или Saab. Будучи осторожным покупате­
лем, Вы идёте в службу потребителей, которая сообщает Вам, что по ре­
зультатам экспертны х исследований Volvo превосходит по механическим
параметрам, а обыватели отмечают более высокую износоустойчивость. Во­
оружённый информацией, Вы реш аете обратиться к дилеру фирмы Volvo
до конца недели. М ежду тем н а одной из вечеринок Вы рассказы ваете зна­
комому о своём намерении, его реакция заставляет Вас задуматься: «Volvo!
Должно быть ты ш утиш ь. У моего ш урина бы ла Volvo. Сначала замыслова­
тая компью терная ш тука, обеспечивающ ая заправку топливом, вы ш ла из
строя. 250 баксов. Затем у него начались проблемы с задним мостом. При­
ш лось его заменить. Потом трансмиссия и сцепление. Через три года прода­
ли на запчасти». Логический статус этой информации таков, что количе­
ство из нескольких сот обывателей, владею щ их Volvo из службы потреби­
телей, возросло на единицу и что средняя частота осущ ествления ремонта
понизилась на йоту по трём или четырём измерениям. Однако, каж ды й, кто
утверж дает, что он не примет во внимание мнение случайного собеседника,
либо не искренен, либо совершенно себя не знает.
136 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Исследование 6. Подверженность влиянию абстрактной информации про­
тив конкретной информации. К аж ется, необходимо воплотить на практи­
к е мы сленны й эксперимент Службы Потребителей (B orgida и N isb ett,
1977). Так к ак наш ими испытуемыми были студенты-психологи Универ­
ситета ш тата М ичиган, мы избрали курсы по психологии в университете в
качестве потребительского товара. Бы ли выбраны десять лекционны х кур­
сов высш его уровня по психологии, различаю щ иеся заявленным качеством.
Группа студентов младш их курсов, планирую щ их выбрать психологию как
свою специализацию , была встречена в кабинете экспериментатором. Он
сообщил студентам, что является членом комиссии ф акультета, которая
заним ается проблемами долговременного планирования работы отделения.
Одна из проблем касается определения того, сколько студентов выберет тот
или иной курс в будущем. Д ля того чтобы определить будущее распределе­
ние студентов по курсам, испытуемых просили заполнить эксперименталь­
ное расписание и отразить их планы в области психологии на старш их кур­
сах.
Испытуемых контрольной группы контроля просили посмотреть на учеб­
ны й план (в действительности имитацию , состоящую из 27 курсов, исклю ­
ч ая лабораторные занятия, занятия по статистике) и поставить галочку р я­
дом с 5 -1 0 курсами, которые они хотят слуш ать, и обвести круж ком помет­
к и для курсов, на которые они точно запиш утся.
Двум экспериментальны м группам сообщили, что с целью облегчения
их выбора им дадут дополнительную информацию относительно лекцион­
ны х курсов, которые выбирают большинство студентов. Д ля обеих групп
эта инф ормация состояла из детального описания, более понятного, чем ан ­
нотация в учебном плане, содерж ания и структуры каж дого из десяти кур­
сов. Затем для испытуемых одной экспериментальной группы организова­
ли беседу со студентами старш их курсов. Эти студенты коротко охаракте­
ризовали каж ды й из десяти курсов, которы е они прослуш али. От одного до
четы рёх, человек обычно два или три, характеризовали каж ды й курс. К аж ­
дая характеристика начиналась с оценки, включающие следующие пять тер­
минов: «отлично», «оченьхорош о», «хорошо», «удовлетворительно», «пло­
хо» . Вот один из примеров:
Хотя курс включает большое количество материала, которое нужно пройти, он очень
хорошо изложен. Вы имеете представление, о своем положении, что очень полезно при
прохождении курса. Это очень обширная и важная область психологии, но причина, по
которой я оценил этот курс, как «очень хорошо», а не «отлично» в том, что материал не
особенно стимулирует мышление.

В другом экспериментальном условии (условие базового значения), ис­


пытуемым было сказано, что они будут читать средние оценки курса, осно­
ванного на ш калах, заполненны х всеми студентами курса в конце предш е­
ствующего семестра. После описания каж дого курса приводилась пятибал­
льн ая ш кала, помеченная от «отлично» до «плохо». Н а каж дой ш кале была
Общепринятое положение... 137
Таблица 1. Среднее число выбранных курсов и взвешенная тенденция выбо­
ра
Рекомендо­ Нерекомендо- Неупомяну­
ванные курсы ванные курсы тые курсы
Условие Коли­ Изме­ Коли­ Изме­ Коли­ Изме­
чество ренная чест­ ренная чест­ ренная
тен­ во тен­ во тен­
денция денция денция
выбо­ выбора выбо­
ра ра

Беседа со
старш екурсниками 4.73* 8.31*,ь 0.50* 0.77*'ь 3.09*>ь 4.32*,ь
(N =22)
Наличие знаний
базового значения 4.11 6.33ь 0 .94 1.56ь 4.17ь 5.89ь
(N =18)
Группа контроля
3.33* 5.22* 1.39* 2.17* 5.39*-" 7.17*
*1=18)
F (2,55) 6.14* 10.34** 6.59* 6.65* 13.24** 8.19**

а означает, что значения в колонке различаются одно от другого на уровне 0.01 по


тесту Ньюмена-Келса (Newman- Keuls)
ь означает, что значения в колонке различаются одно от другого на уровне 0.05 по
тесту Ньюмена-Келса
*р < 0.005, **р < 0.001

помещ ена пом етка, показы ваю щ ая среднюю оценку, и было обозначено
количество студентов, на мнении которых было основано среднее значение.
Эти N располагались по порядку от 26 до 142. Средняя оценка каждого кур­
са указы валась таким образом, чтобы быть идентичной средним оценкам,
данным студентами-старш екурсниками, принимавш ими участие в беседе.
Структура эксперимента позволяет сравнить эффективность рекоменда­
ций, основанных на информации из первых рук, то есть кратких коммента­
риях двух или трех студентов, которые проходили курс, с эффективностью
более устойчивой, глубоко обоснованной информации. В таблице 1 представ­
лено среднее количество рекомендованных (средние оценки 2.50 или луч­
ш е), нерекоммендованных (средние оценки 3.75 или хуже) и неупомяну­
тые курсы , выбранные этими тремя группами. Около каж дой категории
приведена оцененная тенденция выбора, индекс, который дает нулевую над­
бавку к курсу, если его не выбрали, 1, если он был помечен «галочкой» и 2,
если он был обведен «круж ком».
М ожно заметить, что проведение беседы со старш еклассниками имело
большее воздействие на выбор курса. Испытуемые этой группы были склон­
ны пройти рекомендованные курсы и менее склонны пройти нерекомендо­
138 ПРИЧИННОСТЬ И АТРИБУЦИЯ
ванны е или неупомянутые курсы , чем испытуемые контрольной группы.
Н апротив, метод базового значения повлиял только на выбор неупомяну­
ты х курсов.
Можно поспорить, что группа испытуемых, у которых была беседа со стар­
ш екурсникам и, обладала большим количеством информации, чем группа
базового значения. Одной из версий для этого аргумента является именно
то, что мы хотели предложить. Н аш и студенты вели себя, как будто они и з­
влекли больш е информации из комментариев пары человек в личной бесе­
де, чем из сухих, статистических данных целы х совокупностей. Д ругая вер­
сия этого аргумента, - то, что комментарии, сделанные студентами при лич­
ной беседе, содержат очень ценную информацию, не доступную в условии
базового значения, относительно, например, организации курсов, процедур
аттестации.
Чтобы задействовать последнее возраж ение, мы провели аналогичное
исследование с одним важ ны м изменением. Группе базового значения дали
дословные письменные комментарии, сделанные студентами-старшекурс-
никам и, участвующ ими в беседе. Кроме того, эти комментарии были явно
описаны к ак репрезентативные взгляды студентов, проходящ их курс, ото­
бранные из общего количества оценок в конце семестра. В этом случае, на
испы туемы х, которым были доступны устойчивые средние оценки, осно­
ванны е на больш их и полных совокупностях, с дословными комментария­
ми студентов, и со “знанием”, что они являю тся репрезентативными ком­
м ентариям и, было оказано меньше давления в их выборах, чем на испыту­
емы х, которые просто слы ш али устные комментарии старш екурсников в
личной беседе.

К ом м уникация, направленная на конкретизацию


Не трудно понять выводы теории Бертрана Расселла относительно общепри­
нятой индукции и выш еупомянутой ее иллю страции для общих вопросов
общ ения и убеждения. Если на людей не влияю т сухие, статистические дан­
ны е, дорогие для сердец ученых и специалистов, занимаю щ ихся полити­
ческим планированием, то социальный и технологический прогресс должен
приостановиться до тех пор, пока не будут найдены эффективные, конкрет­
ны е, эмоционально интересные пути коммуникативны х заклю чений. Мы
собрали несколько исследований убеж дения, которые, по наш ему мнению,
хорош о понятны в терминах различия между абстрактной и конкретной
информацией. Мы представляем их ниж е в надежде, что они могут служ ить
источником вдохновения реальной ж изни и руководством для исследова­
н ия вопросов, касаю щ ихся природы информации и ее воздействия.
1. Р ан н яя версия Зеленой Револю ции стала возможной в начале 30-ых
годов X X века благодаря прогрессу в методах ведения сельского хозяйства.
П равительство долж ны м образом продолж ало информировать фермеров
Общепринятое положение... 139
страны об этих методах посредством сельскохозяйственных агентов по ок­
ругам, распространяю щ их статистику и правительственные брошюры, и
ж дало сообщений об увеличении урож ая. Таких сообщений не последова­
ло, и скоро стало ясно, что фермеры не приобщ ились к новым методам. П ра­
вительство утвердило программу, предписывающую сельскохозяйственным
агентам направляться на выбранные фермы и вы ращ ивать зерновые куль­
туры вместе с фермерами, используя новые методы. Соседние фермеры, н а­
блюдавшие увеличение урож ая, немедленно приобщ ались к новым мето­
дам.
2. Д линны е списки ож идания в клиниках по обнаружению рака растя­
гивались на месяцы , и так было, начиная с осени 1974. Т акая ситуация сло­
ж илась не из-за вы пуска новой статистики главны м хирургом страны , Аме­
риканской медицинской ассоциацией или любой другой организацией. По­
явление длинны х списков ож идания совпадает по времени с мастектомией,
которую перенесли госпожа Форд и госпожа Рокфеллер.
3. Тимоти Краус, в своей книге, описывающей освещ ение в прессе пред­
выборной кам пании президента в 1972, под названием Мальчики в Автобу­
се (1974), сообщ ала, что накануне выборов больш ая группа репортеров, ос­
вещ ающ их кампанию М акГоверна, согласилась, что он не может проиграть
больше чем на 10 пунктов. Эти люди были репортерами из агентства ново­
стей, телевидения и главны х газет и ж урналов новостей. Они знали, что во
всех опросах М акГоверн отставал на 20 пунктов, и они знали, что за преды ­
дущие 24 года ни один опрос не расходился с итогами выборов более чем на
3% . Однако, они видели своими собственными глазам и, к ак восторженные
толпы людей приветствуют М акГоверна.
4. The New York Times (K aufm an, 1973) недавно взял интервью у граффи-
тиста метро в Нью-Йорке, который сильно обгорел в пожаре, вызванном ис­
крой, которая подожгла его банки с распыляю щ ейся краской. М альчик, и з­
вестный под псевдонимом “Али”, признавался, что за 2 недели до несчастно­
го случая он читал о мальчике по имени Бернард Браун, которого задавило
насмерть, когда он рисовал граффити на поездах. “Возможно, если бы мы
знали им я, которое он использовал, например, ‘Джо 146’, это произвело бы
впечатление, - сказал он, но я помню, к ак смеялся над этим, думая, что он,
наверное, был какой-то пижон, который не знал, что делал... ”
Мы полагаем, что настоящ ее исследование и примеры, взяты е из повсед­
невной ж изни показы ваю т, что некоторые виды информации, которую уче­
ные рассматриваю т к ак подходящую и наводящ ую на выводы, обычно иг­
норирую тся людьми. Другие виды информации, которые являю тся логи­
чески слабее, наталкиваю т на разм ы ш ления и приводят к действиям. Мы
можем думать о ставш ей бесполезной деятельности психологов, которые
больше занимаю тся изучением обработки информации, чем обнаружением
того, что их испытуемые расцениваю т к ак информацию , достойную обра­
ботки.
8. Причинные схемы при принятии решений
в условиях неопределенности*

Амос Тверски и Даниелъ Канеман

М ногие реш ения, которые мы принимаем, к ак в незначительны х, так и в


важ ны х вопросах, зависят от очевидной вероятности событий, таких к ак
выполнение обещ ания, успех предприятия или реакции на действие. Так
к ак у нас нет адекватны х формальных моделей для вы числения вероятнос­
ти подобных событий, их оценка обязательно субъективна и интуитивна.
То, к ак люди оценивают свидетельства, чтобы оценить вероятности, пробу­
дило больш ой исследовательский интерес в недавние годы, например, В.Эд-
вардс (W .E dw adrs, 1968, 25); К анеман и Тверский ( K ahnem an T versky,
1979а, 30); Словик (Slovic, 1972а); Словик и Ф ишхофф ( Slovic FishH off) и
Л и хн етш тей н (L ic h te n ste in , 1977); Т верски й и К анем ан ((T v ersk y и
K ahnem an, 1 9 7 4 ,1 ). Это исследование выделило несколько эвристик при­
н яти я реш ений, которые связаны с характерны ми ош ибками и предубеж­
дениями. Эта часть книги посвящ ена роли причинно-следственного рассуж ­
дения при принятии реш ений в условиях неопределенности и некоторым
предубеж дениям, которые связаны с этим способом мы ш ления.
С психологической точки зрения банально то, что люди стремятся дос­
тигнуть последовательной интерпретации событий, которые окруж аю т их,
и что для достиж ения этой цели служ ит организация событий с помощью
схем причинно-следственны х отнош ений. К лассическая работа М ичетта
(M ichotte, 1963) ярко продемонстрировала тенденцию воспринимать пос­
ледовательности событий в терминах причинно-следственных отнош ений,
даж е когда человек полностью осознает, что отношение между событиями
случайно и что приписанная причинно-следственная связь является иллю ­
зорной. Распространенность причинно-следственных схем при восприятии
элементарны х социальных связей бы ла выдвинута на первый план в 1958

*Данная глава - первая часть книги, которая появилась в редакции М. Фишбайн, Прогресс
в социальной психологии. Hillsdale, N.J.: Lawrence Erlbaum Assoc., Inc, 1980. Переиздано в
соответствии с разрешением.
Причинные схемы при принятии решений... 141
конструктивной работе Х айдера (H eider), а исследование причинно-след­
ственного приписы вания стало одним из центральны х в современной соци­
альной психологии (Jones и другие, 1971; Ross, 1977).
В этой главе описывается роль причинно-следственных схем при приня­
тии реш ений в условиях неопределенности. В частности, мы исследуем оцен­
ки условной вероятности Р (Х/D ) некоторого целевого события X , на основе
некоторого свидетельства или данных D. Д ля психологического анализа воз­
действия свидетельства, полезно различать типы отнош ений, которые ис­
пытуемый мож ет увидеть между D и X . Если D воспринимается к ак причи­
на возникновения или невозникновения X , мы считаем D причинно-след­
ственными данны ми. С другой стороны, если X воспринимается к а к воз­
м ож ная причина D, мы рассматриваем D к а к диагностические данные.
Например, считается, что описание личности А обеспечивает причинно-след­
ственные данные для прогнозирования его поведения, в то время к ак описа­
ние поведения А обеспечивает диагностическую информацию относитель­
но его личности. Если D не является ни причиной, ни результатом X , но они
оба воспринимаю тся к ак последствия другого ф актора, мы считаем D пока­
зательны ми данными. Таким образом, поведение в одной ситуации обеспе­
чивает показательны е данные для поведения в другой ситуации, если обе
манеры поведения расценены к ак проявления одной и той ж е черты . Н ако­
нец, если оказы вается, что D и X , не связаны прямой или косвенной при­
чинной связью , мы назы ваем D случайными данными.
При нормативном рассмотрении теории условной вероятности, различия
между типами отнош ения D к X невещ ественны, и воздействие данных за­
висит исклю чительно от их информативности. Н апротив, мы предполага­
ем, что психологическое воздействие данных зависит от их роли в причин­
но-следственной схеме. В частности, мы выдвигаем гипотезу, что причин­
но-следственные данные имеют большее воздействие, чем другие данные
такой ж е информативности; и что в присутствии данны х, порождаю щ их
причинно-следственную схему, случайные данные, не соответствующие этой
схеме, имеют маленькое значение, или вовсе его не имеют.
В этой части книги мы сравниваем влияние причинны х и диагностичес­
ки х данны х и показы ваем, что лю ди приписываю т большее воздействие
причинны м, чем диагностическим данным равной информативности. Мы
такж е исследуем класс проблем, где отдельно взяты е данны е имеют к ак
причинно-следственное, так и диагностическое значение, и демонстриру­
ем, что интуитивны е оценки Р (Х/D ) зависят от прямого причинного воз­
действия D на X без учета диагностических соображ ений....
142 ПРИЧИННОСТЬ И АТРИБУЦИЯ
П р и ч и н н о е и д и агн о с ти ч е с к о е у м о за к л ю ч е н и е
Логически выведенные асиммет рии
П ричинно-следственная схема носит естественный ход событий; он разви­
вается от причин к следствиям. Мы предполагаем, что легче и более есте­
ственно следовать нормальной последовательности и рассуж дать от причи­
ны к следствию , чем обратить эту последовательность и рассуждать от след­
ствий к причине. Если причинно-следственные выводы действительно бо­
лее легкие и естественные, чем диагностические выводы, то можно ожидать,
что люди выведут результаты из причин с большей достоверностью, чем при­
чины из результатов - даж е, если результат и причина ф актически дают
одинаковое количество информации относительно друг друга. Мы провери­
ли эту гипотезу, используя две различны е величины: оценки условной ве­
роятности и достоверность точности предсказаний.
В одном наборе вопросов мы попросили испытуемых сравнить две услов­
ные вероятности Р (Y/X ) и Р (X /Y ) для пары событий X и Y таких, что (1) X
естественно рассматривается к ак причина Y; и (2) Р (X) = Р (Y), то есть пре­
дельны е вероятности двух событий равны . Последнее условие подразуме­
вает что Р (Y /X ) = Р (Х/Y ). Мы сделали прогноз, что большинство испытуе­
мы х сочтет причинно-следственное отношение более сильны м, чем диагно­
стическое, и ошибочно утвердит, что Р (Y/X ) > Р (X /Y ).
В другом наборе вопросов мы попросили испытуемых сравнить достовер­
ность прогнозов с использованием двух непрерывных переменных: зависи­
мость от одной бы ла дана, а другую необходимо было спрогнозировать. Как
и ранее, задачи построены таким образом, чтобы одна из переменных рас­
сматривалась к ак причинная относительно другой. Если две переменные
обладают подобными предельными распределениями, не существует надеж ­
ной статистической причины ож идать различие в точности, с которой одна
переменная может быть спрогнозирована исходя из другой. Однако мы выд­
винули гипотезу, согласно которой многие испытуемые посчитают, что про­
гнозирование от причины к результату может быть сделано с большей дос­
товерностью, чем предсказание от результата к причине.
Прогнозированная асимметрия между причинными и диагностическими
выводами наблюдалась с двумя типами вопросов. Эффект проиллюстрирован
следующими задачами, где числа в круглых скобках указывают количество
студентов (Университета ш тата Орегон), которые выбрали каж ды й ответ.1
Задача 1 : Какое из следующих событий является более вероятным?
(А), что у девочки голубые глаза, если у ее матери голубые глаза. (N = 69)

1В более раннем варианте этой книги была приведена неправильная - низкая пропорция
ответов “поровну”, основанных на выборке из Израиля. Мы обязаны Анне М. Б. Гонзалес и
Майклу Кубовому за это наблюдение. Настоящие данные, собранные в Университете штата
Орегон, совпадают с результатами, полученными Гонзалес в Йельском университете.
Причинные схемы при принятии решений... 143
(В), что у матери голубые глаза, если у ее дочери голубые глаза. (N = 21)
(-) два события одинаково вероятны. (N =75)

Задача 2: При осмотре старшеклассников в некотором городе, рост мальчиков сравни­


ли с ростом их отцов. Какой из прогнозов является более достоверным?
(A) прогнозирование роста отца по росту сына. (N = 23)
(B) предсказание роста сына по росту отца. (N = 68)
(-) равная достоверность. (N = 76)

Очевидно, что распределение роста или цвета глаз - по сущ еству одно и то
ж е в следующ их друг за другом поколениях. Чтобы проверить восприятие
этого ф акта, мы спросили другую группу из 91 испытуемых, является ли
пропорция матерей с голубыми глазам и в большой выборке матерей и доче­
рей больш ей (N = 15), равной (N = 64) или меньш ей (N = 12), чем пропорция
дочерей с голубыми глазам и. Таким образом, хотя испытуемые оценили
предполагаемые вероятности к ак равные, они оценили “причинную” услов­
ную вероятность выш е, чем “диагностическую ”.
Строго говоря, рост отца не обуславливает рост его сына. В обиходе, одна­
ко, весьма приемлемо говорить, что мальчик высок, потому что рост его отца -
б футов 4 дюйма, в то время к ак утверждение, что рост отца - б футов 4
дюйма, потому что его сын вы сок, соверш енно аномально. В общем, мы
ожидаем асимметрию вывода относительно двух переменных всякий раз,
когда первая объясняет вторую лучш е чем вторая объясняет первую. Д ля
иллю страции, рассмотрим следующие задачи, которые были представле­
ны двум различны м группам испытуемых:
Задача 3: Какое из следующих утверждений имеет больше смысла?
(A) Том тяжелый, потому что он высокий. (N = 63)
(B) Том высокий, потому что он тяжелый. (N = 7)
Задача 4: Какое из предсказаний более достоверно?
(A) прогнозирование роста человека исходя из его веса. (N = 16)
(B) прогнозирование веса человека исходя его роста. (N = 78)

Х отя рост и вес не считаю тся причинами друг друга, большинство испытуе­
мых посчитало, что вы сокий рост человека лучш е объясняет большой вес,
чем наоборот, возможно, потому что прототипичный вы сокий человек об­
ладает больш им весом, в то врем я к а к прототипичный тяж елы й человек не
всегда вы сокий. Соответственно, большинство испытуемых вы разило боль­
шую уверенность в прогнозировании веса человека исходя из его роста, чем
в прогнозировании роста человека исходя из его веса. Т акая асимметрия,
безусловно, не мож ет быть оправдана на статистических основаниях.
Задачи 3 и 4 свидетельствуют о том, что асимметрия вывода происходит
даже при отсутствии прямой причинной связи между этими двумя перемен­
ными - если одна из них (например, рост) более естественно рассматривается
к ак объяснение другой (например, вес). Следующие две задачи иллюстриру­
ют случай, где две переменные рассматриваю тся к ак признаки или проявле­
144 ПРИЧИННОСТЬ И АТРИБУЦИЯ
ния некоторой основной черты. Одна из переменных, однако, обеспечивает
более прямое проявление или более надежную меру основной черты. Мы ож и­
даем, что выводы от более сильного к более слабому признаку будут сделаны
с большей достоверностью, чем выводы в обратном направлении.
Задача 5: Какое из следующих событий является более вероятным?
(A) , то, что атлет выиграл десятиборье, если он выиграл первое состязание в де­
сятиборье. (N=21)
(B) , то, что атлет выиграл первое состязание в десятиборье, если он выиграл де­
сятиборье. (N = 75)
(-) два события одинаково вероятны. (N = 70)

Задача 6: Два теста на интеллектуальные способности проводились в большой группе


студентов: всестороннее испытание длительностью 1 час и 10-минутная сокращенная
версия. Какой прогноз является более достоверным?
(A) прогнозирование результата студента в коротком тесте на основании его ре­
зультата во всестороннем тесте. (N = 80)
(B) прогнозирование результата студента во всестороннем тесте исходя из его ре­
зультатов в коротком тесте. (N = 47)
(-) равная достоверность. (N = 39)

Снова, правильны й ответ “поровну” в обеих задачах. В задаче 5, предпола­


гаем ая вероятность того, что атлет победит в десятиборье равна 1/N , где N -
количество конкурентов. Этому такж е равна априорная вероятность того,
что атлет победит в первом состязании. Следовательно, две условные веро­
ятности долж ны быть равны . В задаче 6, стандартное предположение о ли­
нейны х регрессиях влечет за собой точность в предсказании одного испы та­
н и я исходя их другого. Ответы на обе задачи, однако, показы ваю т явное
предпочтение одному направлению прогнозирования над другим.
В задачах 5 и б речь идет о двух признаках одной и той ж е основной чер­
ты , которы е отличаю тся по выраженности. Победа в десятиборье и победа в
отдельном состязании - оба являю тся проявлениями спортивного превос­
ходства, но первое обеспечивает более вы раж енны й признак превосходства,
чем последнее. Точно так ж е результаты тестов на уровень интеллекта отра­
ж аю т основную черту интеллекта, и всесторонний тест отраж ает более вы­
сокую степень выраженности этой черты , чем сокращ енная версия. Резуль­
таты подтверждаю т гипотезу, что прогнозирование от более сильного при­
зн ака к более слабому связано с большей достоверностью, чем обратное пред­
сказание.
Асимметрии вывода, наблюдаемые в предшествующих задачах, связаны
с асимметриями отношений приближенности, которые исследованы в рабо­
тах Тверского (1977). Эмпирические исследования показываю т, что оценен­
ное подобие заметного объекта или прототипа менее заметному объекту или
варианту меньшее, чем подобие варианта прототипу. Например, насыщен­
ный красны й менее подобен бледно-красному, чем наоборот (Рош, 1975), “хо­
рош ая” форма менее подобна “плохой” форме, чем наоборот, и подобие зна­
Причинные схемы при принятии решений... 145
менитой страны (например, коммунистический Китай) менее знаменитой
стране (например, Северная Корея) меньше, чем обратное подобие (Tversky,
1977). Асимметрии прогнозирования, видимо, следуют тому ж е правилу.
Таким образом, мы воспринимаем сына как более подобного своему отцу, чем
наоборот, и мы такж е приписываем свойства отца сыну с большей достовер­
ностью, чем наоборот. Тот ж е самый процесс, поэтому, может леж ать в осно­
ве, как асимметрии подобия, так и асимметрии вывода.

П ричинная и диагностическая значимость свидетельства


В предыдущ ей главе описывалось, что влияние причинно-следственных
данных на оцененную вероятность последствия больш е, чем воздействие
диагностических данных на оцененную вероятность причины. В настоящ ей
главе исследую тся вопросы, в которы х свидетельство имеет, к ак причин­
ное, так и диагностическое значение по отношению к целевому событию.
Мы исследуем гипотезу, согласно которой люди склонны сосредотачивать­
ся на причинном воздействии данны х, касаю щ ихся будущего, и имеют тен­
денцию пренебрегать диагностическими выводами, касаю щ имися прошло­
го. Сначала мы обсудим класс задач, в которых преобладание причинных
соображений над диагностическими приводит к появлению непоследова­
тельных и парадоксальных оценок вероятности. Следующая пара задач была
представлена Туроффом (1972) в обсуждении метода прогнозирования с вза­
имным влиянием фактов.
З а д а ч а 7а: Какая из следующ их двух вероятностей выше?
(1) вероятность того, что в течение следующих пяти лет Конгресс примет закон о
предотвращении ртутного загрязнения, если количество смертельных случаев,
приписанных отравлению ртутью, в течение следующих пяти лет превысит 500
человек.
(2) вероятность того, что в течение следующих пяти лет Конгресс примет закон о
предотвращении ртутного загрязнения, если количество смертельных случаев,
приписанных отравлению ртутью, в течение следующих пяти лет не превысит
500 человек.

З а д а ч а 7Ъ: Какая из следующ их двух вероятностей выше?


(1) вероятность того, что количество смертельных случаев, приписанных отрав­
лению ртутью, в течение следующих пяти лет превысит 500 человек, если Конг­
ресс примет в течение следующих пяти лет закон о предотвращении ртутного
загрязнения.
(2) вероятность того, что количество смертельных случаев, приписанных отрав­
лению ртутью, в течение следующих пяти лет превысит 500 человек, если Конг­
ресс не примет в течение следующих пяти лет закон о предотвращении ртутного
загрязнения.

Пусть С - событие, что в течение следующих 5 лет Конгресс примет закон


о предотвращ ении ртутного загрязнения, и пусть D - событие, что в течение
следующих 5 лет, количество смертельных случаев, приписанны х отравле­
146 ПРИЧИННОСТЬ И АТРИБУЦИЯ
нию ртутью , превысит 500. Пусть С и D обозначают события, противопо­
лож ны е событиям С и D, соответственно.
Больш инство испытуемых считаю т, что, скорее всего, Конгресс примет
закон, ограничиваю щ ий ртутное загрязнение, если список ж ертв превысит
500 человек, чем если не превысит, то есть P(C /D )>P(C /D ). Больш ое коли­
чество испытуемых такж е оценило к ак менее вероятное событие, что спи­
сок ж ертв достигнет 500 человек, если закон будет принят в течение следу­
ю щ их пяти лет чем, если не будет принят, то есть P(D /C )>P(D /C ). Эти оцен­
ки отражаю т причинные убеждения, что большой список ж ертв повлиял
бы на более скорое принятие мер по предотвращению загрязнения, и что
такая мера будет эффективной для предотвращ ения ртутного отравления.
В выборке из 166 студентов, 140 выбрали модальный ответ на оба вопроса.
Этот внеш не верный образец суждений наруш ает наиболее элементарные
правила условной вероятности.
Ясно, P(C /D )>P(C /D ) подразумевает P(C/D)>P(C). Кроме того, неравен­
ство

Р(С & D)
Р(С /D ) = > Р (С )
P (D )

сохраняется, тогда и только тогда, когда Р (С & D) > Р (С) Р (D), что верно
тогда и только тогда, когда
Р(С & D)
Р (С )< = P (D /C )
Р (С )

что в свою очередь подразум еваетР(Б/С )>Р(Б/С ), если Р (С) и_Р (D) не рав­
ны н улю . С лед овательн о, п о д р азу м евает P (C /D )> P (C /D ), воп реки
P (D /C )> P(D /C ) преобладающему образцу суждений.
Л егко построить дополнительные примеры подобного типа, в которых
интуиция людей наруш ает вычисление вероятности. Такие примеры состо­
я т из пары событий, А и В, таких, что возникновение В увеличивает вероят­
ность последующ его возникновения А , в то время к ак возникновение А
уменьш ает вероятность последующего возникновения В. Н апример, рас­
смотрите следующую задачу.
Задача 8: Пусть А - событие, что до окончания следующего года, Питер установит сис­
тему сигнализации в своем доме^Пусть В - событие, что дом Питера будет обокраден до
конца следующего года. Пусть А и В события, противоположные событиям А и В, со­
ответственно2. _
Вопрос: Какая из двух условных вероятностей, Р (A/В ) или Р (A/В ), выше?
Вопрос: Какая из двух условных вероятностей, Р (В/A ) или Р (В /А ), выше?

2символы А, В, и т.д. введены, чтобы облегчить построение выводов. Испытуемым предла­


гали устные описания событий.
Причинные схемы при принятии решений... 147
П од авл яю щ ее б ольш и н ство и сп ы туем ы х (132 и з 161) за я в и л о , что
Р (A /В ) > Р (A/В ) и что Р (В/А ) < Р (В /А ), вопреки законам вероятности.
Мы интерпретируем этот образец суждений к ак другой признак господства
причинны х соображений над диагностическими. Чтобы оценить природу
этого эффекта, давайте проанализируем структуру задачи 8.
Д ля начала рассмотрим Р (A/В ), условную вероятность того, что Питер
установит сигнализацию в своем доме до конца следующего года, учиты ­
вая, что его дом будет обокраден в течение этого периода. С игнальная систе­
ма могла быть установлена либо до, либо после ограбления. И нформация,
переданная этим условием, то есть предположением о краж е, имеет при­
чинное значение относительно будущего и диагностическое значение отно­
сительно прош лого. Определенно, краж а является причиной для последу­
ющей установки сигнализации, что, в свою очередь, является диагности­
ческим признаком того, что дом не был оборудован ею во время краж и. Та­
ким образом, причинное воздействие краж и увеличивает вероятность уста­
новления сигнальной системы, в то время как диагностическое воздействие
к р аж и ум ен ьш ает эту вероятн ость. П очти единодуш ны е о ц ен ки , что
Р (А /В ) > Р (A/В ) указы ваю т, что причинное воздействие В преобладает
над его диагностическим воздействием.
Такой ж е анализ прим еняется к Р(В/А ): вероятности, что дом П итера
будет обокраден до конца следующего года, учиты вая, что он установит сиг­
нализацию в течение этого периода. Н аличие сигнализации причинно вли­
яет на сокращ ение вероятности последующей краж и; это такж е дает нам
диагностический признак того, что краж а могла побудить Питера устано­
вить сигнализацию .
П ричинное влияние приобретения сигнализации уменьш ает вероятность
краж и; диагностическое влияние установки сигнализации увеличивает эту
вероятность. В данном случае, распространенность суждения, что Р (В/А) < Р
указы вает, что причинное влияние А преобладает над его диагностическим
влиянием. Вместо сравнения причинны х и диагностических воздействий
свидетельства, лю ди, очевидно, оцениваю т условные вероятности Р (A/В ) и
Р (В /А ) преж де всего в терминах прямого причинного эффекта состояния,
что приводит к противоречиям в задачах этого типа.
Сущ ественная особенность задач Туроффа (T uroff) - неопределенное вре­
менное отнош ение между событием, создающ им условие и целевым собы­
тием. Д аж е при отсутствии временной неопределенности, часто создающее
условие событие имеет как причинное, так и диагностическое значение. Про­
деланный анализ приводит к гипотезе, что на оценки условных вероятнос­
тей влияю т причинно-следственные соображения, даж е когда временное
отношение между событиями полностью определено.
Задача 9: Какая из следующих вероятностей выше?
Р (R/H) вероятность того, что в течение 90-ых годов станет необходимым нормирова­
ние топлива для частных потребителей в США, учитывая, что в течение 80-ых произой­
148 ПРИЧИННОСТЬ И АТРИБУЦИЯ
дет значительное увеличение использования солнечной энергии для отопления домов.
Р (R /H ). Вероятность того, что в течение 90-ых станет необходимым нормирование топ­
лива для частных потребителей в США, учитывая, что в течение 80-ых не произойдет
никакого увеличения использования солнечной энергии для отопления домов.

П оучительно рассмотреть нормативный подход (Байеса) к этой проблеме, с


точки зрения различия, которое мы наблюдали между причинными и диаг­
ностическими соображениями. Событие Н, что в течение 80-ых произойдет
значительное увеличение использования солнечной энергии для отопления
домов, имеет, к ак причинное, так и диагностическое значение. Прямое при­
чинное воздействие Н на R является отрицательным. При равном значении
других параметров, значительное увеличение в использовании солнечной
энергии мож ет только облегчить топливный кризис в более поздние годы.
Однако значительное увеличение в использовании солнечной энергии в те­
чение 80-ы х такж е является весомым признаком надвигаю щ егося энерге­
тического кризиса. В частности, это говорит о том, что цены на топливо в
80-ы х достаточно вы соки, чтобы производить инвестиции в использование
солнечной энергии для отопления домов, экономичного для большого коли­
чества потребителей. Высокие топливные цены в 80-ых, в свою очередь, пред­
полагаю т нехватку ископаемого топлива, что увеличивает вероятность нор­
м ирования топлива в последую щ ем десятилетии. Таким образом, п р я­
мое причинно-следственное воздействие Н на R уменьш ает вероятность R,
приним ая во внимание, что диагностические значения Н косвенно увели­
чиваю т вероятность R.
Х отя вопрос относительного значения этих факторов не может быть раз­
реш ен формально, мы утверждаем, что диагностические значения Н могли
перевесить его причинное воздействие. Количество топлива, которое может
быть сэкономлено путем увеличения использования солнечной энергии для
отопления домов, вряд ли, будет достаточно больш им, чтобы предотвратить
надвигаю щ ийся кризис. С другой стороны, дефицит топлива, который под­
разумевает событие Н, является явны м показателем предстоящ его энерге­
тического кризиса. Согласно этой линии рассуж дения, Р (R /H ) > Р (R /H ),
где Н - событие, противоположное Н.
Гипотеза, вы двинутая в этой главе, однако, состояла в том, что люди во­
обще придаю т больше значения прямому причинному влиянию события,
создающего условия, в оценках условных вероятностей и не уделяю т доста­
точного вним ания его диагностическому значению . В задаче 9, эта гипотеза
предполагает, что увеличение использования солнечной энергии для ото­
пления в 80-ы х должно уменьш ить оцененную вероятность нормирования
то п л и в а в 9 0 -ы х . Д ей стви тельн о , 68 и з 83 и сп ы туем ы х за я в и л и , что
Р (R /H ) < Р (R /H ).T ot ж е самый образец суждений наблюдается в других
задачах этого типа, где косвенные диагностические значения условия про­
тиворечат его прямы м причинным значениям. Х отя этот образец суждений
не наруш ает правил вероятности, к ак в задачах Туроффа, он отраж ает, по
Причинные схемы при принятии решений... 149
наш ему мнению, общую тенденцию пренебрегать диагностическим значе­
нием события, создающего условия, в оценках условной вероятности.

Прогнозы, объяснение и пересмотр


В предш ествующ их главах мы представили некоторые ф акты в поддержку
гипотезы, что причинные выводы имеют большую эффективность, чем ди­
агностические выводы. Во-первых, мы показали, что выводы от причин к
следствиям делаю тся с большей достоверностью, чем выводы от следствий
к причинам. Во-вторых, мы показали, что, когда одни и те ж е данные име­
ют, к ак причинное, так и диагностическое значение, первому обычно при­
дают больш е значения, чем последнему в оценках условной вероятности.
Мы обратимся теперь к более общему вопросу соотнош ения между обра­
зом, моделью или схемой системы, например, энергетической ситуации или
личности человека и некоторого исхода или проявления этой системы, н а­
прим ер, увеличение использование солнечной энергии или проявление
враждебности. Модели или схемы обычно использую тся, чтобы спрогнози­
ровать и объяснить исходы, которые в свою очередь служ ат для модифика­
ции или модернизации модели. Таким образом, человек может применять
модель, чтобы прогнозировать исход или оценивать его вероятность; он мо­
ж ет такж е использовать модель, чтобы объяснить возникновение опреде­
ленного события или последствия. Н аконец, он может использовать инфор­
мацию: полученную при возникновении определенного события, при ис­
правлении или пересмотре модели.
П редсказание и объяснение представляю т собой два различны х типа при­
чинного вывода, в то время к ак пересмотр модели - это пример диагности­
ческого вывода. При прогнозировании испытуемый выбирает тот исход,
который наиболее соответствует модели системы. При объяснении, испы ­
туемый определяет те особенности модели, которые, скорее всего, вызовут
указанны й исход. С другой стороны, при пересмотре модели, испытуемый
исправляет или дополняет элементы модели, которые наименее соответству­
ют данным.
Больш инство выводов в повседневной ж изни опираются на модели или
схемы, которые являю тся неточными, неполными и иногда неправильными.
Люди признаю т это и часто стремятся подтвердить, что их модели систем,
такие, как намерения человека или энергетическая ситуация, ошибочны.
Присутствие неопределенности в точности модели имеет значение для надле­
жащего прогнозирования, объяснения и пересмотра. Если в модели встреча­
ются ош ибки, то прогнозы, исходящ ие из этой модели должны быть умерен­
ны или регрессивны, то есть они не должны отклоняться от прогнозирования
базового значения. Например, следует больше воздерживаться от прогнозов,
что человек будет вести себя нехарактерным или необычным образом, если
информация об этом человеке исходит из ненадежного источника, чем если
та ж е информация взята из более правдоподобного источника.
150 ПРИЧИННОСТЬ И АТРИБУЦИЯ
О бъяснения, которые основаны на неопределенных моделях, должны
использоваться с осторожностью, так к ак причинны е факторы , которые
использую тся в объяснении, могут не сущ ествовать в действительности.
Кроме того, объяснение в условиях неопределенности должно всегда осу­
щ ествляться с пересмотром модели. Например, если человек занимается
деятельностью , которая каж ется несовместимой с наш им представлением
о его личности, мы должны серьезно рассмотреть возможность того, что наш е
представление было неправильным, и что оно должно быть пересмотрено в
свете новых данных. Чем больше неопределенность модели и чем более уди­
вительно поведение, тем серьезнее долж ен быть пересмотр. А декватное
объяснение должно принимать во внимание изменения в модели, которые
подразумеваю тся или предложены событием, требующим объяснения. С
нормативной точки зрения, объяснение в условиях неопределенности отно­
сительно модели вклю чает к ак диагностические, так и причинные выводы.
Предыдущ ее исследование показало, что люди обычно “преувеличенно
прогнозирую т” исходя из высоко неопределенных моделей. Например, ис­
пытуемые уверенно прогнозируют профессиональный выбор или академи­
ческую успеваемость человека на основе краткого описания его личности,
даж е если это описание взято и з ненадеж ного источника (K ahnem an и
Tversky, 1973, 4). Н амерения и черты, выведенные из краткого описания
личности, обычно рассматриваю тся к ак причины таких исходов, как про­
фессиональный выбор или успех в учебе. “Преувеличенное прогнозирова­
ние”, которое наблюдается в таких задачах, совместимо с высоким влияни­
ем причинно-следственных данны х, что было проиллюстрировано в преды­
дущ их главах.
В контексте объяснения и пересмотра, преобладание причинного и недо­
статок диагностического рассуж дения - очевидны благодаря большой лег­
кости, с которой люди заклады ваю т причинны е основания для исходов,
которы е они не могли спрогнозировать, и благодаря трудностям, с которы ­
ми они сталкиваю тся при пересмотре неопределенных моделей для разме­
щ ения новых данны х. О казалось, что легче приспособить новый ф акт к су­
ществующей причинной модели, чем пересмотреть модель в свете этого ф ак­
та. Кроме того, пересмотры, которые сделаны с целью размещ ения новых
ф актов, часто минимальны по объему и локальны по характеру.
Чтобы проиллю стрировать это предположение, мы обратимся к наблю­
дениям из более раннего исследования интуитивного прогнозирования
(K ahnem an и Tversky, 1973, 4), о которы х ранее не сообщалось. В этом ис­
следовании, 114 аспирантам-психологам предоставили описание личности
аспиранта Тома В ., предположительно составленное психологом-клиници-
стом, когда Том был старш еклассником , на основе проективны х тестов.
Давалось следующее описание:
Том В. обладает высоким интеллектом, но ему не хватает творческого потенциала. Он
любит порядок и ясность и нуждается в системе, где каждая мелочь находится на своем
Причинные схемы при принятии решений... 151
месте. Манера письма — однообразная и механическая, иногда оживляется несколько
банальными каламбурами и вспышками воображения подобно произведениям науч­
ной фантастики. Имеет сильную тягу к устойчивому материальному положению. Про­
являет мало сочувствия и симпатии к другим людям, не любит взаимодействовать с
другими. Будучи эгоцентричным, тем не менее, имеет глубокое чувство морали.

Испытуемых сначала попросили предсказать область специализации Тома В.,


оценивая девять возможностей в терминах их вероятности. Больш инство
испытуемых приш ло к согласию, что Том, скорее всего, займется информа­
тикой или будет инженером, и менее вероятно, что он будет специализиро­
ваться в общественных дисциплинах и социальной работе или в гуманитар­
ны х науках и педагогике. Ответ на дополнительный вопрос такж е показал
единодушие в том, что проективные тесты не являю тся надежным источни­
ком информации для прогнозирования выбора профессии. После заверш е­
ния задачи предсказания, испытуемым задали следующий вопрос.
На самом деле, Том В. - аспирант на факультете педагогики, и он зарегистрирован в
специальной программе подготовки преподавателей для обучения детей-инвалидов. По­
жалуйста, сформулируйте очень кратко теорию, которая, как Вы полагаете, наиболее
вероятно объясняет отношение между личностью Тома В. и его выбором карьеры.

К аков надлеж ащ ий подход к этому вопросу? И спытуемых поставили перед


очевидным конфликтом между свершенным фактом, выбор карьеры Томом В .,
и детальны м, но ненадежным описанием его личности. Достоверность, с
которой люди прогнозируют выбор профессии исходя из описания личнос­
ти, подразумевает веру в корреляцию между личностью и выбором профес­
сии. Это мнение, в свою очередь, подразумевает, что выбор профессии диаг-
ностичен по отношению к личности. В выш еупомянутом примере, выбор
профессии Томом В. маловероятен ввиду описания его личности, и это опи­
сание взято из сомнительного источника. Поэтому разумный диагностичес­
кий вывод должен привести к существенному пересмотру образа Тома В.,
чтобы привести его в большее соответствие со стереотипом выбранной про­
фессии. Если полагать, что студенты, получающ ие специальное образова­
ние, в целом склонны к состраданию, то выбор профессии Томом В. должен
вы звать сомнения относительно того, что он “проявляет мало сочувствия и
симпатии к другим лю дям”, к ак заявлено в сообщении психолога. А декват­
ный ответ на задачу должен, по крайней мере, допустить возможность, что
личность Тома В. отличается от описания, и что он является на самом деле
добрее и гуманнее.
Н аш и испытуемые не следовали этому подходу. Только незначительное
меньш инство (21% ) упомянуло какие-либо оговорки относительно надеж ­
ности описания. Подавляющее большинство испытуемых, вклю чая скеп­
тиков, реш ило конф ликт либо путем выбора подходящ их аспектов описа­
ния личности Тома В. (например, его глубокое чувство морали), либо путем
новой интерпретации психологической значимости его выбора (например,
как вы раж ение потребности в господстве).
М ожно поспорить, что неспособность наш их испытуемых пересмотреть
образ Тома В. просто отраж ает характеристики задачи, которая была им
предоставлена, а именно “объяснять отношение между личностью Тома В.
и выбором карьеры . ” Согласно этой точке зрения, задача интерпретируется
к ак призы в к попы тке соотнести выбор профессии Тома В. с описанием его
личности, не подвергая сомнению его валидность. Мы считаем, однако, что
распространенная тенденция рассматривать образ Тома В., к ак полностью
достоверный, несмотря на серьезные сомнения, иллю стрирует более ш иро­
кое явление: тенденцию объяснять без пересмотра, даж е, если модель, ко­
торая используется в объяснении, высоко неопределенна.
По наш ем у представлению , ответы испы туемы х иллю стрирую т, к а к
неж елание пересмотреть подробную и последовательную модель, пусть и
неопределенную , так и непринужденность, с которой такая модель может
использоваться для объяснения новых фактов, пусть и неожиданны х. Нас
поразила легкость, с которой наш и испытуемые строили причинные сооб­
раж ения по поводу неожиданного выбора профессии Томом В., и у нас нет
причин полагать, что они были бы менее поверхностны в объяснении дру­
гих неож иданны х действий с его стороны.
Высоко развиты е навы ки к объяснению способствуют общ еизвестной
устойчивости и стабильности впечатлений, моделей, концепций и парадигм
при столкновении с неординарным свидетельством (Abelson, 1959; H ovland,
1959; Ja n is, 1972; Jerv is, 1975; K uhn, 1962). Стимул для пересмотра моде­
ли мож ет исходить только из признания несоответствия между этой моде­
лью и некоторым новым свидетельством. Если люди могут объяснять боль­
ш инство явлений к своему собственному удовлетворению при минималь­
ны х изменениях локального характера в своих концепциях, они редко бу­
дут чувствовать потребность в реш ительном пересмотре этих концепций.
Таким образом, легкость причинного размы ш ления не допускает процесса
диагностического пересмотра....
9. Недостатки процесса атрибуции: о происхожде­
нии и исправлении ошибочных социальных
оценок*

Ли Росс и Крег А. Андерсон

Введение в теорию атрибуции и ошибки атрибуции

Теория ат рибуции и и нт уит ивная психология


Теория атрибуции, в самом широком смысле, рассматривает попы тки обыч­
ны х людей понять причины и значения событий, свидетелями которы х они
являю тся. Она анализирует их “наивную психологию” к ак способ интер­
претировать собственное поведение и действия других. Таким образом, на­
стоящ ее господство в социальной психологии теории атрибуции является
кульминацией длительной борьбы за улучш ение этой дисциплинарной кон­
цепции человека. Не подчиняясь больше закономерности «стим ул-реак­
ция» (S-R) радикального бихевиоризма, вы йдя за границы информацион­
ного процессора и перестав быть искателем когнитивной последовательнос­
ти, человек в психологии получил статус, равны й статусу ученого, который
его исследует. С точки зрения теории атрибуции, люди являю тся интуитив­
ными психологами, которые стрем ятся объяснить поведение других и сде­
лать выводы об их социальном окруж ении.
Чтобы лучш е понимать восприятие и действия этого интуитивного уче­
ного, мы долж ны исследовать методы, которые он использует. Сначала,
подобно ученому-психологу, он руководствуется набором предположений
относительно природы человеческого Я и его поведения - например, что
стремление получить удовольствие и избеж ать боли - распространенные и
сильные мотивы поведения, или что подчинение ж еланиям и ож иданиям
других лю дей, более обычно и требует меньш е дальнейш ей интерпретации,

*В этой главе многое заимствовано, как по содержанию, так и по структуре, из статьи пер­
вого автора в книге “Advances in Experimental Social Psychology” (1977). Разрешение на
использование этих материалов подтверждено.
154 ПРИЧИННОСТЬ И АТРИБУЦИЯ
чем неподчинение. Психолог-любитель, подобно профессиональному пси­
хологу, такж е всецело полагается на данные, хотя они редко соответствуют
формальным требованиям случайности и репрезентативности.
И ногда эти данны е и з первы х рук; чащ е, они являю тся результатом
неофициального общения, получены из средств массовой информации или
других косвенных источников. Далее интуитивный психолог должен выб­
рать или разработать методы кодирования, хранения и восстановления дан­
ны х. Н аконец, он должен использовать различные стратегии для подведения
итогов, анализа и интерпретации данных - то есть он должен использовать
правила, эвристики или схемы, которые позволят ему формировать новые
выводы. Способность интуитивного ученого исследовать свое социальное ок­
руж ение, соответственно, будет зависеть от точности и адекватности его ги­
потез, доказательств и анализов. Наоборот, любые систематические ошибки
в существующих теориях, предубеждения в доступных данных или несоот­
ветствия в методах анализа, влекут за собой серьезные последствия, к ак для
психолога-любителя, так и для общества, которое он создает. Эти недостат­
ки , исследуемые с точки зрения современной теории атрибуции, подробно
анализирую тся в этой гл а в е.1
Основные принципы теории атрибуции были предлож ены Хайдером
(H eider, 1944,1958) и развиты более детально Джонсом и Девисом (Jones &
D avis, 1965), К елли (Kelley, 1967,1971, 1973) и их коллегами (см. Jones и
другие, 1971; W einer, 1974). В центре внимания этих ученых находились
две родственные задачи, с которыми сталкивается ученый-любитель. Пер­
вая - задача причинны х суждений: исследователь стремится определить
причину или набор причин, к которым можно приписать отдельно взяты й
эффект (то есть, некоторое действие или исход). Вторая - задача социально­
го предполож ения: наблюдатель события делает выводы относительно ат­
рибуции или намерений действующ их лиц, а такж е относительно призна­
ков или свойств ситуаций, н а которые они реагировали.
И причинны е оценки, и задачи социального предположения были пред­
метом интенсивного теоретического и эмпирического исследования и , до
недавнего времени, ф актически доминировали в теории атрибуции. В пос­
леднее врем я, однако, начала получать некоторое внимание третья задача
интуитивного психолога - прогнозирование или оценка исходов и поведе­
ния. И нтуитивны й психолог должен не только искать объяснения и делать
выводы о нам ерениях; он должен такж е формировать ож идания и вы ска­
зы вать предполож ения относительно действий и исходов, неизвестных в на­
стоящ ее время или которые произойдут в будущем. Н апример, когда к ан ­
дидат в президенты обещает «облегчить бремя среднестатистического нало­
гоплательщ ика», мы рассматриваем возможные причины для этого заяв­
ления и делаем выводы относительно личны х свойств кандидата. (Возмож­

1 Для более полного и систематического объяснения параллели обыватель-ученый, совету­


ем читателю обратиться к работе Нисбетта и Росса, 1980.
Недостатки процесса атрибуции... 155
но, обещание просто отвечало требованиям политической целесообразнос­
ти? Можем ли мы сделать какие-то выводы об истинны х убеждениях кан ­
дидата?) Но мы такж е, вероятно, будем размы ш лять о последующем пове­
дении этого кандидата и его взглядах, которые касаю тся еще не исследо­
ванны х проблем. (Если его изберут, снизит ли он налог на прибыль с недви­
жимости? Одобряет ли он сокращ ение программ социального обеспечения?)
Таким образом, психология интуитивного предсказания является естествен­
ным продолжением теории атрибуции.
Три задачи атрибуции взаимозависимы согласно логики и психологии.
О бъяснения события и выводы о лю дях, производящ их действия, а такж е
объектах, которые вовлечены в действие, глубоко связаны . Все вместе они
обеспечивают основание для размы ш ления относительно характера собы­
тий, которые являю тся в настоящ ее время неизвестными или, вероятно,
произойдут в будущем. К аж дая задача, однако, предлагает уникальны е воз­
можности (и уникальны е задачи интерпретации и методологии; см. Ross,
1977, стр. 175-179) для раскры тия предположений и стратегий, которые
леж ат в основе поведения интуитивного ученого. Стоит отметить, что в на­
стоящее время стало популярным использование оценок и прогнозов как
зависимых переменных в исследованиях предположений обывателей. Одна
из причин этой увеличивш ейся популярности особенно важ на. Оценки или
предсказания новых или неизвестных событий могут часто вы полняться от­
носительно их точности в отличие от причинных оценочных суждений,
которые исходят из анализа события. То есть можно сравнивать прогнозы и
оценки событий с ф актическими наблюдениями или измерениями. Это по­
зволяет делать оценку к ак относительной адекватности стратегии атрибу­
ции, которую использует интуитивный ученый, так и направления отдель­
но взяты х ошибок и предубеждений.

Логические принципы ат рибуции или эгоцентрические предубеж­


дения
Современная теория атрибуции преследовала две отличительны х, но взаи­
модополняющих цели. Во-первых, продемонстрировать, что оценки и вы ­
воды человека согласуются с некоторой логической или рациональной мо­
делью. Во-вторых, проиллю стрировать и объяснить источники предубеж­
дений или ош ибки, которые искаж аю т эти, по большому счету, правиль­
ные оценки и выводы. Мы кратко рассмотрим так называемые логические
или рациональные правила, используемые интуитивным психологом, а за­
тем остаток главы посвятим источникам ошибок в его попы тках понима­
ния, прогнозирования и управления событиями, которые разворачиваю т­
ся вокруг него.
Принципы “ковариации” и “дисконтирования”. Люди должны, в боль­
шинстве случаев, разделять общее понимание социальных действий и исхо­
156 ПРИЧИННОСТЬ И АТРИБУЦИЯ
дов, которы е их затрагиваю т, поскольку без такого согласия, социальное
взаимодействие было бы хаотичным, непредсказуемым и неуправляемым.
Самоанализ, проведенный теоретиками в области атрибуции, подкрепленный
лабораторными доказательствами, привел к утверждению набора “правил”,
которые могут использоваться в интерпретации поведения и исходов. Эти пра­
вила “здравого смысла” или схемы аналогичны, в некотором смысле более
формальным правилам и процедурам, которым следуют социологи и статис­
тики в своем анализе и интерпретации данных.
К елли, Джонс и их помощ ники выделили два случая, в которых могут
прим еняться логические правила или схемы. В случае множественного
наблю дения приписываю щ ий имеет доступ к поведенческим данным, ко­
торые могли бы быть представлены к ак строки или колонки матрицы отве­
тов: действующий субъект х объект х ситуация (или случай). К ак прави­
ло, в этой области исследований участникам даны скорее заклю чительные
утверждения, чем фактические ответы. Таким образом, потенциальный при­
писываю щ ий узнает, что “Больш инству театралов нравится новая пьеса
П интера”, или “Мэри очень ж алеет беспризорных ж ивотны х” или “един­
ственная телевизионная программа, которую смотрит Энн - M asterpiece
T heatre. ” В случае единичного наблюдения приписываю щ ий должен рас­
сматривать поведение единственного человека в одном случае. Например,
он мож ет видеть, что Сэм исполняет просьбу экспериментатора нанести бо­
лезненны й удар другому человеку, или он мож ет узнать, что “Луи поставил
все свои деньги в P im lico.”
Логические правила или принципы , управляю щ ие атрибуциями в этих
двух случаях, довольно различны (K elley, 1967,1971,1973). В случае мно­
жественного наблюдения приписываю щ ий применяет “принцип ковариа­
ц ии ”; то есть он оценивает степень, в которой наблюдаемое может происхо­
дить в отсутствие каж дого рассматриваемого причинного фактора. Соответ­
ственно, приписываю щ ий делает вывод, что новая пьеса П интера - хороша
в той степени, что она нравится ш ирокому кругу театралов, вы звала похва­
лу людей, которым нравится мало пьес (например, “критикам ”), и что ей
рукоплескали так ж е энергично на девяностый день ее постановки, к ак и на
девяты й.
В случае единичного наблю дения стратегия оценки приписываю щ его
вклю чает применение “принципа дисконтирования”, с помощью которого
социальный наблюдатель “обесценивает” роль любого причинного фактора
в объяснении события настолько, насколько другие вероятные причины или
детерминанты могут быть идентифицированы. Этот принцип атрибуции
мож ет быть по-новому сформулирован скорее в терминах социальных вы ­
водов, чем причинны х атрибуций: насколько ситуативные или внеш ние
ф акторы предоставляю т “достаточное” объяснение события, настолько это
событие приписано ситуации, и логически невозможно сделать никакого
вывода (возможно, и опытным путем) относительно поведения человека.
Наоборот, в какой степени действие или исход происходит вопреки, а не
Недостатки процесса атрибуции... 157
благодаря сопутствующим ситуативным силам, настолько соответствующее
событие приписы вается человеку и делается “соответствую щ ий вы вод”
(Jones и D avis, 1965), то есть приписываю щ ий выводит существование и
влияние некоторой черты , способности, намерения, чувства или другого
свойства, которое могло объяснить действие актора или исход. Таким обра­
зом, мы не согласны с выводом, что крайне рискованная азартная игра Л уи
в Pim lico настолько отраж ала его устойчивые личны е качества, что необхо­
димо упомянуть такие факторы , к ак хорошие чаевые, глубокий финансо­
вый кризис или то, что до игры он вы пил семь рюмок мартини. С другой
стороны, мы сочтем Луи неисправимым азартны м игроком, если узнаем,
что он играл, несмотря на угрозу ж ены уйти от него, если он когда-нибудь
снова потратит зарплату на скачках, несмотря на то, что он знал, что не смо­
ж ет оплатить ж илье, если проиграет, и, несмотря на подслушанное замеча­
ние эксперта, что фаворит на скачках проявляет себя «даже лучш е, чем со­
гласно предварительным оценкам».
Стоит отметить, что применение двух различны х принципов предъявля­
ет различны е требования к интуитивному ученому. П ринцип ковариации
требует, чтобы приписываю щ ий применял правила, которые являю тся ло­
гическими или статистическими по своей природе, и не требует никакого
дальнейш его понимания характеристик рассматриваемых объектов. П ри­
менение принципа дисконтирования, наоборот, требует значительного по­
ним ания природы человека и таких ситуативных сил, как потребность в
деньгах, потребление алкоголя и угроза супруги развестись. В некотором
смысле, принцип ковариации может прим еняться простым “статистиком”,
в то время к ак принцип дисконтирования требует знаний психологии, что­
бы оценить роль различны х социальных воздействий и ситуативных сил и
даже отличать преднамеренные действия и исходы от непреднамеренных
(ср. Jones и D avis, 1965).
Доказательство систематического использования принципов атрибуции
здравого смысла можно обнаружить, преж де всего, в исследовании с при­
менением анкетного опроса, в котором испытуемые читали и интерпрети­
ровали краткие рассказы о реакциях одного или нескольких людей н а не­
которые объекты при указанных обстоятельствах (например, L. Z. M cA rthur,
1972, 1976). Проведенные по этому поводу исследования меньш его масш ­
таба предоставили приписываю щ ему, по-видимому, подлинные ответы ,
события и исходы (например, Jones, Davis и G ergen, 1961; Jones и DeCharms,
1957; Jones и H arris, 1967; S trickland, 1958; T hibaut и Riecken, 1955). Это
исследование показало, что приписываю щ ие могут использовать, по край ­
ней мере, некоторые гипотетические принципы или практические методы.
То, что методологии, используемые до настоящ его времени, оставляли без
вним ания, так это степень точности обывателей, а такж е величину и на­
правление их ошибок.
158 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Эгоцентричные мотивационные предубеждения в атрибуции. В размыш ­
лении относительно возможных искаж ений в другой логической системе
атрибуции, теоретики быстро сформулировали предубеждения “эго-защ и­
ты ”, с помощью которого приписываю щ ие сохраняли или усиливали чув­
ство собственного достоинства или положительное мнение о своем поведе­
нии и способностях (H eider, 1958; Jones и D avis, 1965; Kelley, 1967). По­
п ы тки доказать сущ ествование такого мотивационного предубеж дения
вклю чало проявление асимметрии в атрибуции положительных и отрица­
тельных исходов, в особенности, тенденция для действующих лиц припи­
сывать “успехи” своим собственным усилиям, способностям или поведению,
а “ош ибки” - удаче, трудности задач или другим внеш ним факторам. Зада­
чи на успеваемость (например, D avis и D avis, 1972; F eather, 1969; Fitch,
1970; W olosin, Sherm an и Till, 1973) и обучающее поведение (например,
Beckm an, 1970; Freize и W einer, 1971; Johnson, Feigenbaum и W eiby, 1964)
предоставили яркое свидетельство этой асимметрии. Такж е было показа­
но, что действующие лица могут больше хвалить себя за успех и меньшее
обвинять за неудачи, чем наблюдатель, оценивающий те ж е самые исходы
(Beckm an, 1970; G ross, 1966; Polefka, 1965).
К ритики, скептически относящ иеся к распространенным мотивацион­
ным предубеждениям, однако, испы тали трудности в экспериментальном
подтверждении этого (см. M iller, Ross, 1975, такж е N isbett и Ross, 1980, см.
гл. 10, для детального рассмотрения). Наиболее веские аргументы против
исследования, показывающ его мотивационные предубеждения - это оче­
видное несоответствие между личным восприятием испытуемых и их выс­
казанны м и оценками. Можно без труда создать ситуации, в которых чело­
век будет публично отрицать ответственность (или заявлять о ней) за слу­
чай, который он на самом деле принимает (или не принимает) к ак свою от­
ветственность. В то время к ак вы сказанны е оценки могут быть эгоцентрич­
ны в смысле сохранения общественного мнения о себе, они не подразумева­
ют действие предубеждений эго-защ иты для сохранения репутации в своих
собственных глазах (M iller, 1978).
Кроме того, асимметрии в личны х приписываниях успеха и неудачи (не­
зависимо от того, были ли они доступны исследователям) и различия в оцен­
ках самих людей и наблюдателей могут отраж ать другие немотивационные
источники предубеждений. К ак отметили некоторые исследователи, успех,
по крайней мере, в экспериментальны х ситуациях, ожидается и не проти­
воречит прошлому опыту актора, в то время к ак неудача мож ет быть не­
предвиденной и неожиданной. Точно так ж е успешные исходы преднаме­
ренны и являю тся объектами планов и действий человека, в то время как,
неудачи - это случайные события, которые возникаю т, несмотря на планы
человека и его усилия. Н аблю датели, кроме того, редко знаю т о прошлом
опыте или настоящ их ож иданиях и намерениях акторов, свидетелями чьих
результатов они являю тся.
Недостатки процесса атрибуции... 159
П опытки опровергнуть существование глубоких предубеждений эго-за­
щ иты , были к ак эмпирическими, так и концептуальны ми. Так, испытуе­
мые в некоторы х исследованиях проявляю т “контрзащ итны е” или умень­
ш аю щ ие оценку, предубеж дения. Н апример, Росс, Бьербрауер и Полли
(Ross, Bierbrauer и Polly, 1974), используя достоверную парадигму учитель -
ученик, обнаруж или, что учителя оценивали свои собственные действия и
способности к ак более важ ны е детерминанты скорее неудачи, чем успеха.
И наоборот, учителя оценивали усилия и способности своих учеников как
более важ ны е детерминанты успеха, чем неудачи. В этом ж е исследовании
эти на вид контрзащ итны е тенденции атрибуции признавались больше сре­
ди профессиональных преподавателей, чем среди неопытных студентов стар­
ш их курсов, — результат, который противоречил очевидному выводу из
теории эго-защ иты : то, чему непосредственно угрож ает неудача, должно
быть более защ ищ енны м.
Исследователи, настаивающ ие на существовании эгоцентричных мотива­
ционных предубеждений, могут, конечно, предоставить альтернативные ин­
терпретации исследований, в которых не проявляю тся мотивационные или
контрзащ итные предубеждения (ср. Bradley, 1978). Действительно, во мно­
гих отнош ениях споры между сторонниками этой теории и скептиками ста­
ли напоминать более ранние и обширные споры о теории обучения и базового
восприятия, в которых бесплодность поиска “решающего” эксперимента, ка­
сающегося мотивационных влияний (т э есть, такого, который не может ин­
терпретироваться “другой стороной”), стала более очевидной, чем во время
накопления данных и усиления концептуального анализа.
Одной из ответных реакций на такое положение дел должен был стать вре­
менный отказ от мотивационных конструкций и сосредоточение внимания на
немотивационных факторах (то есть, информационных и познавательных, а
такж е факторах восприятия), которые влияют и потенциально искажают оцен­
ки атрибуции. Помимо существующих концептуальных трудностей, смешан­
ных результатов, полученных опытным путем, и исторических уроков, пре­
пятствующих исследователям, которые искали бы мотивационные предубеж­
дения, существуют две дополнительные причины для изменений в настоящий
момент. Во-первых, все возрастает убеждение, что более серьезная оценка не­
мотивационного влияния могла бы привести к пониманию и предвосхищению
тех обстоятельств, в которых приписывания ответственности увеличили бы
чувство собственного достоинства приписывающего, а такж е обстоятельств, в
которых такие приписывания уменьшили бы его (ср. M iller и Ross, 1975). Во-
вторых, все больше признается тот факт, что точные атрибуции вообще явля­
ются более “эгоцентричными”, чем неточные, то есть, что искаж ения причин­
ного суждения способны приводить организм в состояние, плохо подготовлен­
ное к задаче долгосрочного вы живания, каким и бы благоприятными ни были
немедленные последствия неточных восприятия и влияний.
О стальная часть этой главы рассматривает ограниченное количество та­
ких немотивационных предубеждений (см. N isbett и Ross, 1980, для более
160 ПРИЧИННОСТЬ И АТРИБУЦИЯ
полного обзора). В ней такж е обсуждается явление, которое увеличивает
“удельный вес” таких предубеждений - сохранится тенденция ошибочных
впечатлений, оценок и даже более обширных теорий, несмотря на наличие
логически мощ ных данных, противоречащ их этим убеждениям. Давайте
признаем с самого начала, что ошибки и предубеждения, с которыми мы стал­
киваемся вовсе не являю тся необъяснимыми погрешностями со стороны ин­
туитивного ученого. К ак правило, они отражают действие механизмов и стра­
тегий, которые вполне хорошо удовлетворяют потребности организма во мно­
гих обстоятельствах; иначе они не пережили бы историю обучения человека
или эволюционную историю вида. Эти ошибки и предубеждения могут спра­
ведливо быть расценены как “определенные сферы” сбоя логически выведен­
ных стратегий и тактик, которые целесообразны (и вероятно, такж е весьма
точны) с точки зрения опыта организма в целом.

Н е м о ти в а ц и о н н ы е п р ед у б еж д ен и я атр и б у ц и и

Ф ундам ент альная ошибка атрибуции


И дентифицированное первым (H eider, 1958) и наиболее часто упоминаемое
немотивационное предубеждение, которое мы назовем фундаментальной
ошибкой атрибуции, — это тенденция наблюдателей недооценивать воздей­
ствие ситуативных факторов и переоценивать роль диспозиционных ф ак­
торов на поведение других. Будучи “ интуитивными ” психологами, мы,
вероятно, слиш ком часто оказы ваем ся нативистами или сторонниками ин­
дивидуальны х различий, и слиш ком редко бихевиористами. С большой го­
товностью мы рассуждаем о чертах характера и ожидаем последовательно­
сти в поведении или исходах в совершенно несопоставимых ситуациях и
контекстах. Мы делаем поспешные выводы после наблюдения поведения
других людей, не замечая воздействия соответствующих сил окружаю щ ей
среды и ограничений.
Общие факты, свидетельствующие о фундаментальной ошибке атрибуции. Помимо
коротких рассказов и обращения к опыту, наиболее часто упоминаемое свидетельство
для этого предубеждения (например, Jones и Nisbett, 1971; Kelley, 1971) заключается в
очевидной готовности наблюдателей делать “соответствующие” личные выводы от­
носительно участников исследования, реагирующих на явное давление ситуации. На­
пример, Джонс и Харрис (Jones и Harris, 1967) обнаружили, что слушатели находили
некоторое соответствие между замечаниями участников дискуссии в поддержку Каст­
ро и их личными установками даже, если слушатели знали, что участники дискуссии
повиновались экспериментатору, и у них не было выбора.
Более прямое доказательство того, что наблюдатели могут игнорировать
или недооценивать давление ситуации, предоставил Бирбрауэр (B ierbrauer,
1973), когда изучал впечатления испытуемых от воздействия в классичес­
ком эксперименте М илграма (1963). В исследовании Бирбрауэра, участни­
ки были свидетелями дословного воспроизведения акта “повиновения” од-
Недостатки процесса атрибуции... 161
ного из испытуемых, готового нанести максимальны й разряд электрош ока
предполагаемой ж ертве. Независимо от того, почему и насколько произош ­
ла задерж ка в выставлении оценок, независимо от того, обладали они за­
конным правом делать оценки или просто наблюдали, участники исследо­
вания Бирбрауэра допустили фундаментальную ош ибку атрибуции. То есть
они последовательно и серьезно недооценивали степень, в которой испыту­
емые уступили бы давлению ситуации, которое вызвало повиновение в экс­
перименте М илграма (см. Рисунок 1). Другими словами, они предполага­
ли, что повиновение отдельно взятого испытуемого выражало скорее его лич­
ные характеристики, чем возможности ситуативных воздействий и огра­
ничений, под влиянием которых оказались все испытуемые.
Особый случай преимущества, обусловленного ролью, при самопрезента-
ции. Тенденция социальных наблюдателей недооценивать возможности вли­
ян и я и ограничений ситуации и переоценивать роль индивидуальных черт
часто наблюдалась в стратегии, концептуальных исследованиях и даже про­
фессиональных спорах представителей современной социальной психоло­
гии (см. N isbett и Ross, 1980; Ross, 1977). Особые случаи этой фундамен­
тальной ош ибки атрибуции помогают сосредоточить наш е внимание на про­
цессах-посредниках и более специфических ош ибках интуитивного психо­
лога. Важным с этой точки зрения является эксперимент Росса, Эмебайл и
Стейнмец (Ross, Am abile и Steinm etz, 1977), в ходе которого анализирова­
лись оценки, сделанные относительно участников, роли которы х (случай­
но назначенные) давали или не давали им преимущ ество. Росс и др. рас­
сматривали роли ведущего и игрока в викторине по выявлению общ их зна­
ний. Роль ведущ его обязы вала испытуемого составить набор вопросов по
общим знаниям , излож ить эти вопросы игроку и обеспечивать точную об­
ратную связь после каж дого ответа игрока. Роль игрока была ограничена
ответом или попыткой ответить на соответствующие вопросы. От двух уча­
стников (и, в последующем воспроизведении, такж е от наблюдателей) тре­
бовалось оценить общие знания к ак ведущ его, так и игрока.
Произвольное назначение и выполнение этих ролей заставило участни­
ков и наблюдателей сталкиваться с очевидно нерепрезентативными или ис­
каж енны м и “выборками” знаний ведущ их и игроков. Роль ведущего спо­
собствовала демонстрации скры ты х знаний и давала возможность избежать
ситуаций, показы ваю щ их их невежество; игроки ж е были лиш ены таких
преимущ еств в самопрезентации. Действительно, не было сомнения в про­
извольности назначения роли или в различии преимущ еств, связанны х с
каж дой ролью, в отличие от ситуаций реальной ж изни, в которых соци­
альны е роли так ж е предоставляют преимущ ества и неудобства в самопре­
зентации. Однако соревнование в неравных условиях между ведущ ими и
игроками последовательно вело к предубеждениям и ошибочным впечатле­
ниям. У частники, в некотором смысле, просто не сумели сделать скидку на
преимущ ества и неудобства соответствующих ролей, обусловленных ситу-
162 ПРИЧИННОСТЬ И АТРИБУЦИЯ

q Прогнозы, сделанные б ез
промедления
х
ф
а А Задерж ка прогнозирования,
О
X вызванная смущением

д Задерж ка прогнозирования
ф без смущения
X
X Ф Значения, полученные
§■ Милграмом (1963)
о
а

Уровень электрошока Волы

Р и с -1. Сравнение спрогнозированных и ф актических значений не­


повиновения
ацией. Таким образом, игроки оценили своих ведущ их выш е себя, а неза­
висимые наблюдатели согласились с этим (см- Рисунок 2). Наблюдатели,
вооруженные знанием, что ведущие не смогли бы ответить на заданные воп­
росы лучш е, чем игроки, должны были признать, что уровень знаний игро­
ков не был таким уж низким . Вместо этого, они сделали вывод, что ведущие
обладали действительно выдаю щ имися знаниями- Интересно, что самих
ведущ их не ввела в заблуждение слож ивш аяся ситуация- Этот ф акт смещ а­
ет наш е внимание с сущ ествования фундаментальной ош ибки атрибуции и
определенного воздействия социальных ролей к особым “выборкам данных”,
на которые полагались различны е участники в своих выводах.

Рис. 2. Оценки общих знаний ведущ их и игроков


Недостатки процесса атрибуции... 163
В отличие от игроков и наблю дателей, ведущие не были вынуждены пола­
гаться исклю чительно на “искаж енны е” выборки общих знаний. Возмож­
но, они обладали рядом дополнительных доказательств степени и ограни­
ченности собственных общих знаний, а такж е относительно нерепрезента-
тивности той информации, которую они показали в своих вопросах; следо­
вательно, они оценили, и свои знания, и знания игроков к ак “средние”.
И социальное, и теоретическое значение эксперимента Росса, Эмебайл и
Стейнмец вполне понятно. Он побуждает нас рассматривать бесчисленные
социальные контексты , в которы х официальные или неофициальные роли
ограничиваю т межличностное взаимодействие и, таким образом, искаж а­
ют впечатления участников настолько, что каж утся оправданными преро­
гативы и ограничения, наложенные выгодными или невыгодными ролями.
Он такж е побуждает нас заострить внимание на одной из ошибок интуитив­
ного ученого - его каж ущ ейся нечувствительности к ограниченному значе­
нию искаж енны х выборок данных (см. такж е H am ill, W ilson и N isbett, 1980;
N isb e ttn Ross, 1980, Гл. 4).

Предубеж дения замет ност и и доступност и


Возможно, наиболее исследованная область предубеж дения атрибуции,
которая вклю чает эффекты вним ания, а такж е когнитивны х факторов и
факторов восприятия, которы е опосредуют внимание. О казы вается, что
всякий раз, когда некоторый аспект окружаю щ ей среды становится непро­
порционально сущ ественным или “доступным” для человека, воспринима­
ющего его (cp. Tversky и K ahnem an, 1973,11), этому аспекту придаю тболь-
ше значения в причинно-следственном приписывании. Таким образом, ког­
да участник визуально привлекает на себя внимание из-за особенного расо­
вого или сексуального статуса в пределах большей группы (Taylor и другие,
1976), из-за некоторой поразительной особенности внешнего вида или одеж­
ды (M cA rthur и P ost, 1977; M cA rthur и Solom an, 1978), из-за поставленной
учителем задачи (R egan и T otten, 1975), или даж е из-за размещ ения людей
на местах или других показателей визуальной перспективы (например,
Storm s, 1973; T aylor и Fiske, 1975), то на этого человека налагается непро­
порционально больш ая ответственность за любой результат его действий.
(См. T aylor и Fiske, 1978, для более полного обзора.) Действительно, множе­
ство исследований, полученных на основе теории “объективного самосоз­
н ания” (D uval и W icklund, 1972; W icklund, 1975) показали, что навосприя-
тие людьми их собственных причинны х ролей можно такж е повлиять с по­
мощью простых м анипуляций, которые направляю т их внимание на себя
как социальны х объектов или наоборот (например, D uval и H ensley, 1976;
Ellis и Holmes, 1979).
П ризнание и понимание того, к ак факторы заметности или доступности
влияю т на процесс атрибуции, могут помочь лучш е понять основы многих
знакомы х предубеждений атрибуции, а такж е логически выведенных пре­
164 ПРИЧИННОСТЬ И АТРИБУЦИЯ
дубеждений, возможно даж е отнеся их к особым случаям. Ф ундаменталь­
н ая ош ибка атрибуции, например, может отраж ать тот ф акт, что участни­
ки являю тся просто более заметными, чем условия окружаю щ ей среды и
поэтому более вероятно, что они будут первоначально замечены при поиске
причинны х факторов. Действительно, когда ситуативные факторы и огра­
ничения становятся непропорционально заметными для наблю дателя, мы
можем ож идать ошибок атрибуции, которые каж утся противоположными
так называемой фундаментальной ош ибке. Таким образом, инспектор мо­
ж ет ошибочно приписать действительно хорошее выполнение задания ра­
бочим внеш нему фактору, то есть своему наблюдению, когда этот внеш ний
фактор становится чрезвычайно существенным (см. S trickland, 1958). Точно
такж е, внутренний интерес человека при выполнении данной задачи мо­
ж ет бы ть подорван (например, Deci, 1971; Lepper и G reene, 1975, 1978;
Lepper, G reene, и N isbett, 1973), если его внимание сосредотачивается на
внеш нем стимуле или ограничении, которое, к ак каж ется, поощ ряет, но не
обязательно, выполнение этой задачи.
Рассмотрим такж е эмпирическое обобщение Джонса и Нисбетта (Jones &
N ibbett, 1971), согласно которому акторы, объясняя свое поведение, больше
склонны ссылаться на ситуативные факторы и менее - на факторы, относя­
щ иеся к характеру самого человека, чем наблюдатели такого поведения. Н а­
сколько участники и наблюдатели проявляю т соответствующие различия в
том, что находится в их центре внимания, то есть участники проявляю т инте­
рес к соответствующим особенностям окружаю щ ей среды, в то время как
наблюдатели сосредотачивают свое внимание непосредственно на участни­
к а х ,- настолько обобщение Джонса и Нисбетта становится особым случаем
обобщения внимания/атрибуции. Действительно, экспериментально подтвер­
ждено что, перемещ ая центр внимания акторов и наблюдателей, их тенден­
ции ссы латься на ситуативные или на внутренние причины, могут аналогич­
но меняться (например, Storm s, 1973; Taylor и Fiske, 1975).
Н аконец, рассмотрим недостаток, отмеченный проницательным вымыш ­
ленны м детективом-психологом Ш ерлоком Холмсом - тенденцию недооце­
нивать значение не-происшествий (non-occurence). Информативные не-проис-
шествия - это события или действия, которые не произош ли в некотором
контексте, но которы е, таким образом, содерж ат потенциально важную
информацию (ср. Росс, 1977). Определенная релевантность низкой когни­
тивной доступности не-происш ествий долж на быть очевидна. П ри исследо­
вании или рассмотрении причинных факторов, не-происш ествия вряд ли
являю тся высоко заметными или вряд ли им уделяется внимание; соответ­
ственно, невозможно придать им достаточно значения в объяснении наблю­
даемы х действий и исходов. Д ж илл, скорее всего, припиш ет гнев Д ж ека
чему-то, что она «соверш ила», чем чему-то, чего она не смогла сделать, про­
сто потому, что первое является более заметным для нее, чем последнее. Дей­
ствительно, приним ая во внимание, что вина упущ ения является менее су­
Недостатки процесса атрибуции... 165
щ ественной, чем вина соверш ения поступка, Д ж ек способен допустить ту
ж е самую ош ибку в объяснении причин собственного гнева.

Ложный консенсус или эгоцентрическое предубеждение атрибуции


Последнее немотивационное или “информационное” предубеждение, рас­
сматриваемое в этой главе, касается оценок человеком социального согла­
сия - каж ущ аяся обычность или необычность различны х реакций, кото­
рые они наблюдают. В отличие от профессионального психолога, который
полагается на четкие методы формирования выборки и статистические про­
цедуры для проведения таких оценок, обыватель, долж ен полагаться на
интуицию и субъективные впечатления, основанные на соответствующих
данны х, доступ к которым у него ограничен. Возможностей для предубеж­
дения в таких оценках и в различны х социальных выводах или приписыва­
ниях, которы е отраж аю т такие оценки, очень много. Определенное преду­
беждение приписы вания, которое мы здесь рассмотрим, касается тенден­
ции людей чувствовать “лож ны й консенсус”, то есть считать свои собствен­
ные поведенческие выборы и оценки к ак относительно обычные и соответ­
ствующие данным обстоятельствам, рассматривая альтернативны е ответы
как необычные, ненормативные и несоответствующие.
Ссылки на “эгоцентрическую атрибуцию ” (H eider, 1958; Jones и N isbett,
1971), “атрибутивное проектирование” (Holm es, 1968) и на определенные
выводы и явления, связанные с предубеждениями ложного консенсуса, слу­
чайно появились в литературе, посвящ енной социальному восприятию и
приписыванию (ср. K atz и A llport, 1931; K elley и Stahelski, 1970). Возмож­
но, наиболее веское свидетельство можно найти в ряде исследований Росса,
Грина и Х ауса (Ross, G reene & H ouse, 1977).
В первом упомянутом исследовании, испытуемые рассматривали описа­
ния гипотетических конфликтны х ситуаций, с которыми они могли бы стол­
кнуться и долж ны были (а), оценить обычность двух возможных альтерна­
тив реакции; (Ь) указать альтернативу, которую они сами бы избрали; (с)
оценить черты “типичного” человека, который выбрал бы каж дую из двух
указанны х альтернатив.
Оценки продемонстрировали эффект “ложного консенсуса”; испытуемые
рассудили, что альтернатива, которую они выбрали, будет более обычная, чем
невыбранная альтернатива. Очевидное заклю чение к предположению лож ­
ного консенсуса - то, что интуитивный психолог оценивает те реакции, кото­
рые отличаются от его собственных, к ак раскрывающ ие устойчивые черты
характера действующего лица в более полном объеме, чем реакции, подоб­
ные его собственным. Данные Росса, Гринаи Хауса (1977) подтверждают этот
прогноз; испытуемые делали сравнительно более достоверные и крайние про­
гнозы относительно типичного человека, который осуществил бы невыбран-
ную испытуемым альтернативу, чем относительного того, кто осуществил бы
выбранную альтернативу.
166 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Термин относительный является критическим в этой формулировке
предубеж дения лож ного консенсуса и требует некоторого разъяснения.
Очевидно, человек, которы й идет по канату натянутом у меж ду двумя не­
боскребами, устраивает революцию или принимает обет безбрачия, призна­
ет, что немногие люди разделили бы его выбор. Предубеждение ложного кон­
сенсуса, однако, привело бы его к пониманию своего выбора к ак более нор­
мального, чем показалось бы лю дям, которые не стали бы ходить по канату,
устраивать революцию или принимать обет безбрачия. Точно так ж е тезис
признает, что для некоторых категорий реакции оценки всех оценивающих
могут иметь отклонения в равной степени. Случаи жестокого обращ ения с
детьми, например, могут быть одинаково недооценены как родителями, ж е­
стоко обращ ающ имися со своими детьми, так и обычными родителями. От­
носительные термины гипотезы ложного консенсуса приводят только к про­
гнозированию того, что родители, жестоко обращ ающ иеся со своими деть­
м и, оценят это явление как более обычное и менее раскрываю щ ее личные
качества, чем обычные родители.
П ри заклю чительной демонстрации Росса, Грина и Хауса (1977) не ис­
пользовалась гипотетическая методология анкетного опроса, а испытуемые
были поставлены в условия реальной и последовательной ситуацию конф ­
ликта. И спытуемых попросили походить по студенческому городку в тече­
ние 30 минут с рекламны м щ итом, на котором было написано «Обедайте в
каф е “У Д ж о” ». Экспериментатор пояснил испытуемым, что они могут лег­
ко отказаться от участия в исследовании, но ему бы хотелось, чтобы они
участвовали и “помогая научно-исследовательской работе, узнали кое-что
интересное”. Затем испытуемых просили принять реш ение относительно
участия в исследовании, оценить вероятные реш ения других и сделать вы ­
воды относительно черт характера людей, согласивш ихся или отказавш их­
ся участвовать.
Результаты этой “реальной” конфликтной ситуации (Табл. 1) подтвер­
дили выводы более ранних исследований в форме анкетного опроса, касаю ­
щ ихся гипотетических ответов. В целом, испытуемые, согласивш иеся но­
сить рекламны й плакат, оценили, что 62% человек сделает такой ж е вы ­
бор. И спытуемые, которые отказались это делать, оценили, что только 33%
лю дей и сп олн и т просьбу эксп ери м ен татора. К роме того, к а к и было
спрогнозировано, согласившиеся и не согласившиеся испытуемые резко рас­
ходились в относительной силе выводов, которые они хотели сделать о че­
ловеке, согласивш емся и отказавш емся носить рекламны й плакат. Согла­
сивш иеся испытуемые сделали более уверенные и экстремальные выводы
относительно личны х характеристик отказавш егося человека; не согласив­
ш иеся испытуемые сделали более резкие выводы относительно согласив­
ш егося человека.
Недостатки процесса атрибуции... 167
Таблица 1. Эффект ложного консенсуса: оценки обычности и выводы от­
носительно черт характера с точки зрения двух альтернатив поведения

Сила выводов относительно


черт характера*
Оценен­ Оценен- О тести- О тестя­
ная обыч ная обыч- руемых, руемых,
ность ность отказа согласив- отказав-
согласия (%) шихся носить шихся носить
(%) плакат плакат
Испытуемые,
согласившиеся
носить плакат 62 38 120,1 125,3
Испытуемые,
отказавшиеся
носить плакат 33 67 139,7 106,8

а) сумма оценок для четы рех черт; большее число обозначает большую
уверенность и более крайние выводы
Источник: обобщено из Ross, G reene и H ouse (1977).

Общие выводы по результатам Росса, Грина и Х ауса (1977) для наш ей кон­
цепции интуитивного психолога очевидны. Оценки отклонения и нормы, и
совокупность социальных выводов и межличностных реакций, которые со­
провождаю т такие оценки, являю тся смещ енными в соответствии с соб­
ственными поведенческими выборами обывателей. Очевидно, что анализ
приписы вания мож ет быть искаж ен не только ош ибками в анализе соци­
альны х данны х интуитивным психологом, но такж е и более ранними пре­
дубеждениями в формировании выборки или оценке таких данных.
Некоторые немотивационные факторы играю т роль в создании явлений
ложного консенсуса. Главные среди них: (а) факторы выборочного воздей­
ствия и доступности; (Ь) факторы , имеющие отношение к разреш ению си­
туативной неоднозначности.
Ф акторы выборочного воздействия, леж ащ ие в основе ложного консен­
суса, довольно просты. Очевидно, мы знаем и общ аемся с лю дьми, которые
разделяю т наш опыт, интересы, ценности и взгляды . Эти люди действитель­
но реагирую т так, к ак отреагировали бы мы в ш ироком разнообразии обсто­
ятельств. Действительно, наш е окруж ение частично определено чувствами
общего консенсуса, и мы склонны избегать тех, кто вряд ли разделяет наш и
оценки и реакции. Тот ф акт, что мы выступаем перед пристрастной выбор­
кой людей и поведения не требует, чтобы мы допускали ош ибку в наш их
оценках относительно соответствующих совокупностей, но оно делает та­
кие ош ибки вероятными. Ф акторы , усиливаю щ ие наш у способность вспо­
168 ПРИЧИННОСТЬ И АТРИБУЦИЯ
м инать, визуализировать или воображать образцовые случаи поведения
являю тся более тонкими и когнитивны ми по характеру. В данной ситуа­
ции определенные типы поведения, которые мы выбрали или выбрали бы
могут быть с большей легкостью восстановлены из памяти и более легко пред­
ставлены , чем противоположные типы поведения. Согласно Канеману и
Тверскому (1973,4) поведенческие выборы, которым мы отдаем предпочте­
ние, могут быть более когнитивно “доступны”, и нас можно ввести в заб­
луж дение этой легкостью или трудностью доступа при оценивании вероят­
ности соответствующ их поведенческих выборов.
Второй немотивационный источник эффекта ложного консенсуса явл я­
ется результатом реакции интуитивного психолога на неоднозначность -
к а к относительно природы и величины ситуативных сил, так и относитель­
но значения и последствий различны х альтернатив реакции. П опытки снять
такую неоднозначность включаю т интерпретацию , оценку и догадки, при­
чем все это мож ет оказы вать параллельны й эффект на собственные выборы
поведения наблюдателей, а такж е на их прогнозы и выводы относительно
выборов других людей. Таким образом, испытуемые, которые ож идали и
боялись насмеш ек других людей, потому что на них была табличка «Обе­
дайте в каф е “У ДЖ О” », а такж е те, которые сочли пож елания и ож идания
экспериментатора банальны ми, вероятно, откаж утся носить рекламны й
щ ит, поддерж ат подобные отказы других людей и сделают соответствую­
щ ие выводы относительно черт характера любого испытуемого, который со­
гласился носить табличку. Противоположные приоритеты, конечно, при­
вели бы к противоположным личным выборам и противоположным соци­
альны м оценкам и выводам.
И так, предубеждение ложного консенсуса, к ак отраж ает, так и создает
искаж ения в процессе атрибуции. Оно следует из неслучайного формирова­
н ия выборки и поиска свидетельства и от необычного реш ения неоднознач­
ны х ситуативны х факторов и сил. В свою очередь, оно смещ ает оценки от­
носительно нормы и отклоняется и увеличивает расхож дения и ошибки в
интерпретации социальных явлений.

У сто й ч и в о сть у б еж д ен и й в о п р ек и о п ы ту
Различны е недостатки интуитивного психолога, те, которые описаны в этой
главе и ряде других работ (см. N isbett и Ross, 1980), могут привести его к
тому, что он будет придерж иваться убеждений о себе, других лю дях или
даж е природе социального мира, которые являю тся преждевременными и
ош ибочными во многих случаях. П ока о них никто не знает и никто на них
не влияет, такие убеж дения могут казаться непоследовательными - просто
предварительными по сути и адаптивными к новым входным данным. По­
степенно увеличиваю щ ийся объем теории и исследования, однако, может
теперь привести к совершенно противоположному выводу.
Недостатки процесса атрибуции... 169
О казы вается, что убеж дения, от относительно узких личны х впечатле­
ний до более ш ироких социальных теорий, являю тся очень устойчивыми
вопреки опыту, который каж ется логически разруш ительны м. Две пара­
дигмы иллюстрируют эту устойчивость. П ервая включает способность убеж­
дения продолжает сущ ествовать и усиливаться новыми данны ми, которые,
с нормативной точки зрения, должны приводить к тому, что убеждения ста­
новятся более умеренными. Вторая вклю чает сохранение убеждений после
отрицания их первоначальных оснований.

Устойчивость убеждений и поляризация в свете появления новых


данны х
Люди, общественные организации, группы интересов и даж е нации часто
обладают различаю щ имися убеждениями о важ ны х социальных или поли­
тических проблемах. Такие расхож дения во мнениях едва ли являю тся уди­
вительными. У читы вая неофициальное и часто чисто интуитивное основа­
ние, на котором такие мнения базирую тся, а такж е роль, которую соци­
альные коммуникации (часто очень необъективные) играю т в формирова­
нии наш их убеждений, разногласия являю тся неизбежными. Но что про­
исходит, когда сторонникам различны х точек зрения, позволяю т проана­
лизировать определенное свидетельство, особенно, когда оно носит формаль­
ный характер и идентично для всех заинтересованных сторон?
Оптимистическое ожидание состоит в том, что соперничающие группиров­
ки наш ли бы компромисс между своими убеждениями. Этот компромисс
может вклю чать смещение в сторону позиции, определенной соответствую­
щим свидетельством, если оно последовательно и неоспоримо; с другой сто­
роны, он мог бы состоять из изменения в сторону большей умеренности или
взаимной терпимости, если свидетельство неоднозначно или неокончатель­
но. Менее оптимистическое ожидание состоит в том, что соперничающие груп­
пировки остались бы при своих точках зрения; то есть они проигнорировали
бы новое свидетельство и устойчиво придерживались бы своих первоначаль­
ных позиций. Недавний эксперимент, проведенный Лордом, Леппером и Рос­
сом (Lord, Lepper & Ross, 1979), приводит к более удручающему выводу (по
крайней мере, для тех, кто надеется или ожидает, что объективные данные
ученого в области социальных наук урегулируют социальные споры).
Лорд и другие (1979) сначала отобрали испытуемых, которые либо под­
держ ивали высшую меру н аказания, считая ее эффективной превентивной
мерой (сторонники), либо выступали против высш ей меры наказания и по­
лагали, что она не является сдерживаю щ ей (противники). Испытуемых оз­
накомили с двумя подлинными эмпирическими исследованиями. Одно го­
ворило в поддержку их позиции; другое опровергало их мнение. При чтении
этих исследований, две группы дали оценки относительно этих двух исследо­
ваний и изменений в своих собственных отнош ениях и мнениях. Эти оценки
ярко показали способность сторонников определенной теории интерпретиро­
170 ПРИЧИННОСТЬ И АТРИБУЦИЯ
вать новое свидетельство так, чтобы усилить и подтвердить свою теорию. Во-
первых, к ак сторонники, так и противники высшей меры наказания после­
довательно оценили исследование, поддерживающее их убеждения, к ак “бо­
лее убедительное” и “лучш е проведенное”, чем исследование, которое их оп­
ровергало. Во-вторых, и в отличие от любой нормативной стратегии, кото­
рую можно вообразить для вклю чения нового свидетельства в убеждения че­
ловека, влияние чтения двух исследований должно было еще больше поля­
ризовать убеждения противников и сторонников смертной казни. То, к ак про­
изош ла эта поляризация, было особенно очевидно (см. Рисунок 3). После чте­
ния краткого отчета о результатах, который поддерживал их точку зрения,
убеждения испытуемых стали значительно более экстремальными; эти из­
менения поддерживались или увеличивались при рассмотрении подробнос­
тей относительно процедуры и данных. Наоборот, после чтения краткого от­
чета о результатах, который опровергал их собственную точку зрения, мне­
н ия испытуемых стали менее экстремальными; а после чтения соответству­
ющ их подробностей относительно процедур и данных испытуемые возвра­
щ ались к убеждениям, которые у них были до ознакомления с исследовани­
ем. Ф актически, большое количество испытуемых, которые прочитали, как
резюме результатов, так и процедурные подробности исследования, опровер­
гающего их мнение, в конечном счете, стали более уверены в правильности
этого убеждения! Таких эффектов не наблюдалось, когда те ж е самые резуль­
таты и процедуры были прочитаны испытуемыми, чьи начальные представ­
ления поддерживались.
Очевидно, профессиональные ученые часто виновны в той ж е ошибке,
что и интуитивны е. Снова и снова каж ды й видит к ак соперничающ ие груп­
пировки, которые вовлечены в академические споры - является ли их те­
мой происхождение Вселенной, эволюция человека или существование пре­
дубеждений атрибуции эго-защ иты - получают поддерж ку для своих раз­
личаю щ ихся мнений из одного и того ж е источника. Далее в этой главе мы
подробно рассмотрим процесс, леж ащ ий в основе таких явлений и более
конкретно прокомментируем нормативный статус готовности ученого пе­
рерабатывать свидетельство в свете существующих теорий и ожиданий. Сна­
чала необходимо рассмотреть второй общий класс явлений устойчивости.
Недостатки процесса атрибуции... 171

Являются сторонниками
высшей меры наказания Е ) сторонники
+3
I I противники

+2

+1

Без изменений О

Являются противниками -1
высшей меры наказания Является превентивной Не является превен-
мерой тивнои мерой
------- 1------------ 1--------------- 1------------ - 4 - -----

1 2 3 4
Результаты Подробности Результаты Подробности

Являются сторонниками
высшей меры наказания
+2

+1

Без изменений О

-1

Являются противниками -2
высшей меры наказания Является превентивной Не является превен-
мерой тивной мерой

1 2 3 4
Результаты Подробности Результаты Подробности

Рис. 3. Верхний рисунок: изменение отнош ения к высш ей мере на­


казан и я, сообщаемое испытуемыми, вовремя эксперимента, кото­
рые сначала рассматривали исследование, подтверждающее эффек­
тивность смертной казни в предотвращ ении преступлений. Н иж ­
ний рисунок: изменение отнош ения к высш ей мере наказания, со­
общаемое испытуемыми, вовремя эксперимента, которые сначала
рассматривали исследование, опровергающее эффективность смер­
тной казни в предотвращ ении преступлений
172 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Устойчивость убеждений после очевидной дискредитации
И ногда, убеждениям угрожаю т не новые данные, а скорее требования при­
вести свидетельство формирования такого убеж дения, то есть прежде всего
информацию или анализ, который привел к формированию этого убежде­
н ия. Н а уровне коротких рассказов легко привести такие примеры. Салли
терпит неудачу в своих первых попы тках научиться кататься на коньках и
затем вы ясняет, что коньки, которые она позаимствовала, были слиш ком
больш ие, чтобы обеспечивать ей поддерж ку в области лоды ж ек. Мэри пред­
полагает, что букет цветов Д ж она отраж ает заботу, романтичный характер
и следование традициям, но затем узнает, что отец Джона - владелец цве­
точного м агазина. Более ш ирокие теории или убеждения о мире могут оспа­
риваться подобным образом. П риходящ ая няня на основе опыта с единствен­
ным младенцем, который кричал всю ночь, реш ает, что кормление из бу­
ты лки приводит к коликам у младенцев, а затем обнаруживает, что этот ре­
бенок страдал от высокой температуры. И ли ученый обнаруживает, что клас­
сический эксперимент, на основании которого появилась некоторая теория,
не является чистым из-за внеш них факторов или прямого мош енничества.
Гипотеза устойчивости, в своей общей формулировке, гласит, что люди,
о которы х упоминалось выш е, отстаивали бы свои начальные убеждения до
степени ничем неоправданной. Но термины такого утверж дения очевидно
слиш ком общие и неопределенные, чтобы их можно было проверить. Когда
именно мы сможем сделать вывод, что субъект “неуместно” упорствует в
своих впечатлениях или убеж дениях, хотя их основание было подорвано?
Чтобы исследовать гипотезу устойчивости экспериментально, нам точно
потребуется парадигма, которая позволит точно определять степень устой­
чивости и изменений.
Одна такая парадигма в форме дилеммы бы ла предложена социальными
психологами, которые использовали обман в ходе эксперимента, а затем оп­
раш ивали испытуемых, которые являлись целью такого обмана. Психоло­
ги показы вали надуманный и недостоверный характер предоставленной ин­
формации, предполагая, что подобное рассмотрение эксперимента устранит
любое влияние, которое такая инф ормация, могла бы оказать на мнения
или убеж дения испытуемых. Многие ученые, однако, вы разили общее бес­
покойство, что такие экспериментальные обманы могут нанести большой
вред, который не будет полностью устранен с помощью обычных процедур
рассм отрения (наприм ер, K elm an, 1972; A .G . M iller, 1972; O m e, 1972;
Silverm an, 1965).
Р яд экспериментов, проведенных Леппером, Россом и их коллегами (см.
такж е более ранние исследования W alster и других, 1967; V alins, 1974) ис­
пользовали общую парадигму дисконтирования или рассмотрения, с целью
исследования явлений устойчивости убеждений при столкновении с очевид­
ной дискредитацией. Мы начнем обсуждение этой работы, выделив пару
экспериментов Росса, Леппера и Хаббарда (Ross, Lepper & H ubbard, 1975),
Недостатки процесса атрибуции... 173
которые касаю тся впечатлений испытуемых после рассмотрения обмана о
своих способностях в некоторой задаче или о способностях других людей.
Устойчивость личных впечатлений после их опровержения. Процедура,
используемая Россом и другими (1975) бы ла достаточно прямолинейной.
Испытуемые сначала получали продолжительную ложную обратную связь
вовремя выполнения задачи на проницательность (то есть, отличие подлин­
ных сообщений о самоубийстве от вымыш ленных). В первом эксперименте
было сообщено, что целью исследования является анализ того, как испытуе­
мые управляю т восприятием собственного поведения и способностей. Во вто­
ром эксперименте были привлечены наблюдатели, которые формировали со­
циальные впечатления, когда были свидетелями управления ложной обрат­
ной связью. В обоих экспериментах после того, как манипуляция первыми
впечатлениями была закончена, экспериментатор полностью дискредитиро­
вал «сведения», на которых были основаны впечатления участников и \и ли
наблюдателей. В частности, участник (реплику которого в Эксперименте 2
нечаянно услыш ал наблюдатель), получил стандартное опровержение дан­
ных, благодаря чему он узнал, что предполагаемый исход был предопреде­
лен и что его обратная связь была абсолютно не связанна с фактическим пове­
дением. Прежде чем значения зависимых переменных были представлены,
каждого испытуемого подвели к явному подтверждению его понимания ха­
рактера и цели экспериментальной фальсификации.
После этой полной дискредитации первоначальной информации, испы­
туемые заполняли анкету с зависимыми переменными, описывающими дей­
ствия людей и их способности. Устойчивость впечатления была очевидна
как для участников, так и д ля наблюдателей. Ф актически при каж дом и з­
мерении (то есть, объективные оценки только что произведенного акта по­
ведения участника, оценки поведения относительно будущего набора за­
дач на проницательность и субъективные оценки его способностей) полнос­
тью дискредитированная м анипуляция первичного исхода произвела суще­
ственные “остаточные” эффекты на участников и оценки наблюдателей (см.
таб. 2).
Последующие эксперименты показали, что разнообразие необоснованных
личных впечатлений, когда-то вы званных в соответствии с эксперименталь­
ными процедурами, мож ет сохраниться даж е после дискредитирую щ их
процедур. Н апример, Дженнингс, Леппер и Росс (Jennings, Lepper & Ross,
1980) продемонстрировали, что впечатления испытуемых относительно их
способности в межличностном убеждении (успех или неудача убедить кон­
федерата стать донором крови) могут сохраняться после того, к ак они узна­
ли, что начальны й исход был полностью недостоверен. Точно так ж е в двух
сходных экспериментах Леппер, Росс и Л ау (Lepper, Ross & Lau, 1979) по­
казали, что ошибочные впечатления студентов относительно их “способно­
сти реш ать логические задачи” (и их выборы специализации с последую­
щей оценкой через два месяца) упорно сохранялись даж е после того, к ак
174 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Таблица 2. Восприятие поведения и способностей участника после опро­
вержения
Л ичное восприят ие Восприят ие участ ников
участ ника наблю дат елям и
успех неудача t усп ех н еудача t
Оцененное
первоначаль­ 18.33 12.83 5,91*** 19.00 12.42 4.43***
ное кол-во
Прогнозирование 14.25 4.23*** 19.08 14.50 2.68*
18.33
будущего числа
Оцененные 2.65* 5.33 4.00 3.36**
5.00 3.83
способности

*р < 0.05. * * р < 0 .0 1 . * * * р < 0.001.


Источник: Данные второго эксперимента, проведенного Россом, «Пеп­
пером и Хаббардом (1975).

они узнали, что хорошие или плохие методы обучения явились объяснени­
ем успехов или неудач, служ ивш их основанием для таких впечатлений.
Устойчивость дискредитированных теорий после опровержения. Недав­
ние эксперименты Андерсена, «Пеппера и Росса (1980) расш ирили область
проявлений устойчивости от личны х впечатлений до более обширных убеж­
дений о реальном мире. В исследованиях Андерсена и других сначала со­
здавались, а затем дискредитировались теории испытуемых относительно
ф ункциональны х отнош ений меж ду двумя измеряемы ми переменными:
адекватностью профессиональных действий пож арны х и количеством оч­
ков, набранных в тесте на предпочтение риска. В одном варианте формиру­
ющ ие сведения состояли из пары определенных случаев, то есть, один со­
стоявш ийся и один несостоявш ийся пож арны й с соответствующим проти­
воречивым количеством очков в тестах на предпочтение риска. Интересно,
такие минимальны е данные были достаточными, чтобы породить устойчи­
вые теории, со стороны испытуемых, относительно вероятных связей меж­
ду соответствующ ими измерениями. Более важ ны м был вывод, что такие
теории переж или опровержение - рассматриваемые случаи были полнос­
тью ф иктивны м и, и различны е испытуемые, ф актически, получили проти­
воположные пары очков рискованности и результатов работы. Действитель­
но, когда сравнения были сделаны между испытуемыми, с которыми экс­
перимент проанализирован, и теми, с которыми нет, оказалось, что более
чем 50% начального эффекта информации в рам ках “случая” осталось пос­
ле опроверж ения.
Недостатки процесса атрибуции... 175
И так, ясно, что убеждения могут сохраняться, несмотря на сильные ло­
гические или эмпирические сомнения. Они могут сохраняться и даже уси­
ливаться за счет сведений, которые, к ак согласилось бы большинство нейт­
ральны х наблюдателей, логически должны приводить к некоторому ослаб­
лению таких убеждений. Они могут даж е сохраняться после полного разру­
ш ения их первоначальных основ. Необходимо сделать многое для опреде­
ления точных пределов и исследования неизбежных исклю чений к таким
явлениям . Ясно, что издерж ки предубеждений атрибуции обывателей и
другие недостатки не подвержены коррекции, но вместе с тем сглаж иваю т­
ся за счет последующего опы та и обсуждений. Вопрос, который необходимо
наконец задать -- это как и почему такая устойчивость имеет место? То есть,
каки е когнитивны е механизмы леж ат в основе необоснованного постоян­
ства наш их впечатлений, убеждений и более ш ироких социальных теорий?

Возможные м еханизмы , лежащие в основе устойчивости убежде­


ний
Пристрастный поиск, воспоминание и ассимиляция информации. Не при­
ходится сомневаться, что наш и убеждения влияю т на процессы, с помощью
которы х мы ищ ем, храним и интерпретируем соответствующую информа­
цию. Действительно, без предшествующего знания и соответствующих пре­
дубеждений, наш е понимание ежедневного опыта требовало бы значитель­
но большего времени и усилий, и по всей вероятности, в результате снизи­
лось бы понимание. Но неизбежное последствие наш ей готовности обраба­
ты вать сведения в свете наш их априорных убеждений - это тенденция вос­
принимать большее подтверждение для этих убеждений, чем фактически
сущ ествует в данны х сведениях.
Такие “предубеждения подтверж дения” (см. E inhorn и H ogarth, 1978;
H am ilton, 1979; H astie и K um ar, 1979; W ason и Johnson-L aird, 1972) отме­
чались философами на протяж ении продолжительного времени (например,
Bacon, 1620/1960). Возможно, наиболее примечательна реакция сторонни­
ка теории на сомнительные или неоднозначные данные. К ак утверждал Лорд
и другие (1979), потенциально подтверждающ ие сведения могут быть при­
няты номинально (как таковые), в то время к ак потенциально опровергаю­
щие сведения подлеж ат критическому и скептическому исследованию. Та­
ким образом, существуют два следствия: во-первых, любой образец сведе­
ний, обработанных этим способом, даж е сведения, которое являю тся по су­
ществу случайными имеет тенденцию поддерживать начальные убеждения.
Во-вторых, к ак только сведения были обработаны таким способом, они по­
лучают способность усиливать априорные убеждения, когда это убеждение
подвергается новому эмпирическому опровержению или нападениям на его
первоначальное очевидное основание.
176 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Роль предвзятой ассимиляции бы ла убедительно показана для случая,
где сторонник теории встречается с новыми данными (т.е. Lord и другие,
1979). Но роль этого механизма в опровержении парадигмы , возможно, ме­
нее очевидна, и мы вынуждены полож иться скорее на предположение, чем
на твердые данные. Мы предполагаем, что испытуемый, который формиру­
ет начальное впечатление о себе, другом человеке или некоторых функцио­
нальны х отнош ениях, способен искать дополнительные данные, соответ­
ствующие этому впечатлению , в своей пам яти и в непосредственной ситуа­
ции. Такие данные могут вспоминаться и рассматриваться к ак подходящие
или подтверждаю щ ие только настолько, насколько они доказываю т насто­
ящ ее впечатление. Таким образом, испытуемый, который преуспел или по­
терпел неудачу в данной задаче, вспоминает подобные успехи или неудачи
в похож их задачах - и принимает реш ения по поводу их релевантности дан­
ному случаю - на основе соответствия исходов. Точно так ж е испытуемый,
реш ив, что переменные X и Y функционально связаны , вспомнит и придаст
правдоподобность случаям, которые, скорее подтверждают, чем оспарива­
ют это предположение. О пять ж е, такой предвзяты й поиск, вспоминание и
ассим иляция не только поддерживают первоначальное убеждение, они так­
ж е создают образец доказательства, который остается доступным для под­
держ ания рассматриваемого убеж дения, когда его первоначальное основа­
ние атаковано или даж е разруш ено. К ритическое предполож ение здесь
заклю чается в том, что люди не постоянно совершенствуют или переоцени­
вают сведения, соответствующие их убеждениям. Они обычно не приходят
к решению “теперь, когда моя предш ествую щ ая гипотеза была несколько
подорвана, я должен возвратиться и переоценить все сведения, которые я
когда-либо рассматривал в свете этой гипотезы ”.
Формирование причинных объяснений. Люди более чем просто замечают све­
дения, соответствующие их впечатлениям или убеждениям. Они такж е уча­
ствуют в причинном анализе или объяснении (H eider, 1958). То есть они про­
буют объяснить характеристики себя или других людей, или функциональ­
ные отнош ения, в существование которых они верят. Таким образом, испы­
туемая, которая считает, что она лучш е или хуж е отличает сообщения о са­
моубийстве в исследованиях Росса (1975), могла бы найти аспект своей био­
графии, который объяснит наличие или отсутствие такого таланта. Точно так
ж е испытуемый, который вынужден верить в положительные или отрица­
тельные отнош ения между способностью к пожарному делу и предпочтени­
ем риска, будет иметь мало трудностей в определении логического основания
для любых отношений. Опять ж е, этот процесс не только поддерживает на­
чальное впечатление или убеждение, он такж е способен сохранить это впе­
чатление или убеждение при возникновении сомнений или критике.
Свидетельство действия этого механизма устойчивости мы можем найти
в двух исследованиях опроверж ения, демонстрирующ их, что, когда испы­
туемым необходимо сформулировать такие объяснения до опровержения,
Недостатки процесса атрибуции... 177
величина эффекта устойчивости растет. В исследовании Андерсона и дру­
гих (1980), одну группу испытуемых попросили объяснить положительные
или отрицательные связи в двух случаях с пожарными. К ак и было спрог­
нозировано, вмеш ательство сильно усилило эффект устойчивости. Ф акти­
чески, испытуемые, которые объясняли основание для положительных или
отрицательны х связей до опроверж ения, были только чуть менее уверены в
них, чем испытуемые, которые не получили никакого опровержения. По­
добные результаты были получены Россом, Леппером, Стреком и Стейнмец
(1977), обнаруживш ими, что испытуемые, которым было необходимо объяс­
нить дальнейш ую ж изнь пациентов клиники (чьи истории болезни они чи­
тали), продолжили расценивать такие исходы как относительно вероятные
даж е, когда они узнали, что события были недостоверны и выдуманы экс­
периментатором.
Поведенческое подтверждение или гипотеза “самоисполнения" ( self-
fulfilment ). Две парадигмы исследования, используемые Россом, Леппером
и их коллегами для исследования явления устойчивости испытываю т не­
достаток одного элемента, которы й мож ет быть критическим во многих
ежедневных ситуациях. Определенно у испытуемых в этих исследованиях
не было возможности воздействовать на свои убеждения. Такие действия
важ ны частично, потому что они могут увеличивать психологические затра­
ты или “диссонанс” (F estinger, 1957), связанны й с изменением убеждений
(ср. A shm ore и Collins, 1968; Collins и H oyt, 1972;H ovland, Campbell, и Brock,
1957). Кроме того, такие действия создают новые данные, соответствующие
этим убеж дениям. Эти новые данные могут быть обработаны предвзято,
кроме того, они могут быть смещены в направлении, подтверждающ ем со­
ответствующую гипотезу.
Идея гипотезы само-подтверждения или самоисполнения не нова для со­
циологов. И звестные, но спорные исследования, например “эффект П игма­
лиона” (R osenthal и Jacobson, 1968), связанны е с воздействием ожиданий
преподавателей относительно “скачка” в способностях и поведении их сту­
дентов, являю тся актуальны ми. Однако, недавние исследования, проведен­
ные Ш найдер (Snyder) и его коллегами, значительно продвинули наш у оцен­
ку и понимание таких явлений, демонстрируя, как ож идания испытуемых
или гипотезы , которые они должны проверить, могут порождать их “объек­
тивную поддержку” (например, Snyder и Swann, 1978а, 1978b; Snyder, Tanke
и B erscheid, 1977).

Заклю чит ельны е замечания: Убеждения меняются!


Н аш е предш ествую щ ее обсуж дение явлени й и м еханизм ов не долж но
заставить читателя потерять из виду тот ф акт, что убеждения о нас, наш их
политических лидерах и даж е наш их научных теориях действительно ме­
няю тся. Частично такое изменение мож ет просто быть результатом грубой
силы . Д аж е если логические или эмпирические опровержения имеют мень­
ш е воздействия, чем могли бы гарантировать нормативные стандарты (см.
Ross и Lepper, 1980), они все-таки могут подействовать. Частично, такое из­
менение мож ет отраж ать ф акт, что формальные методы тестирования ги­
потезы , иногда преднамеренно использую тся, чтобы защ итить нас от опас­
ностей неофициальных методов. Но мы подозреваем, многое еще предстоит
исследовать, так как существует свидетельство того, что предшествующие
теории могут иногда изменяться без огромного количества опровержений
или убедительных экспериментов. Таким образом, изменения в мировоз­
зрении и убеж дениях, которые могут быть вы званы ярки м , конкретны м,
непосредственным опытом (см. N isbett и Ross, 1980) и эффективность групп
и лидеров, которые выполняю т серьезные политические или религиозные
преобразования, предлагают цели для будущего исследования.
10. Очевидное воздействие базового значения*

Амос Тверски иДаниелъ Канеман

Во многих ситуациях людям необходимо оценить вероятность некоторого


целевого события (например, диагноз пациента или продажи учебника) на
основе (а) частоты базового значения целевого исхода в некоторой совокуп­
ности (например, частота различны х диагнозов или распределения продаж
учебника), (Ь) определенного доказательства данного случая (например, ре­
акция пациента на диагностические осмотры или оглавление рассматрива­
емого текста).
Важность данных базового значения в интуитивны х прогнозах относи­
тельно частны х случаев была изучена Милом и Роузеном (МееЫ и Rosen,
1955), которы е, используя правило Байеса утверж дали, что прогнозирова­
ние редкого исхода (например, самоубийства) на основе ненадеж ны х дан­
ных - это главны й источник ошибок в клиническом прогнозировании. Мил
и Роузен не проводили экспериментальны х исследований, но они привели
примеры из литературы по клиническому диагнозу, в котором информация
базового значения не была принята во внимание.
Чтобы получить экспериментальное воздействие данных базового значе­
ния, мы предоставили испытуемым описание аспиранта или специалиста и
попросили их спрогнозировать его область специализации или его профес­
сию (K ahnem an и T versky, 1973,4). Эти исследования показали, что после­
дующие оценки вероятности были определены преж де всего степенью, в
которой описание было подобно или репрезентативно соответствующему
стереотипу специалиста (например, библиотекарям или адвокатам). Часто­
тами базового значения этих категорий, которые были либо известны испы ­
туемым из их ежедневного опы та, либо явно указаны в вопросе, в значи­
тельной степени пренебрегали. (Мы используем термин пренебрегать, что­
бы описать ситуации, в которых базовое значение либо игнорируется, либо
крайне недооценивается.)

*Эта работа была поддержана Службой военно-морских исследований согласно Контракту


N00014-79-C-0077 со Стэндфордским университетом.
180 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Прогнозы на основе репрезентативности или подобия не зависят от час­
тот базового значения. Однако явление пренебрежения базовым значением
гораздо более распространено, так к ак оно такж е наблюдается в оценках,
которые не могут с легкостью интерпретироваться в терминах репрезента­
тивности (H am m erton, 1973). Д ля примера, Касселле, Ш оенбергиГрейбойз
(Casscells, Schoenberger, и G rayboys, 1978) задавали 60 студентам и персо­
налу М едицинского факультета в Гарварде следующий вопрос:
Если анализ, для обнаружения болезни, распространенность которой == 1 /1 .0 0 0 , имеет
ложную положительную пропорцию 5% *, какова вероятность, того, что человек, у ко­
торого обнаружили, положительный результат, фактически болен, если предположить,
что вы ничего не знаете о симптомах этого человека? (с.999)

Наиболее обычный ответ, который дали почти половина участников, был


95% . Средний ответ был 56% и только 11 участников дали правильны й от­
вет - 2% , предполагая, что анализ правильно вы являет каж дого больного
человека. Очевидно даж е высоко образованные респонденты часто не в со­
стоянии оценить важ ность базового значения исхода в относительно про­
сты х формальных задачах (см., например, B ar-H illel, 1980а; Lyon и Slovic,
1976). Осуждение Милом и Роузеном (1955) неспособности оценивать базо­
вое значение не ограничивается клиническими психологами; это такж е свой­
ственно и врачам, и вообще обывателям.
У словия, при которых данные базового значения использую тся или ими
пренебрегаю т, ш ироко исследовались социальными психологами и учены­
ми, изучаю щ ими производство суждений (см. литературные обзоры Borgida
и B rekke (1981) и K assin (1979b)). Н езависимые переменные, рассмотрен­
ные в этих исследованиях, могут быть разделены на два типа: процедурные
и доказательны е. Процедурные переменные относятся к свойствам проек­
та, задачи и демонстрации, в то время к ак доказательны е переменные каса­
ю тся характера источника и интерпретации сведений.
Н апример, процедурная переменная большой важ ности - обращ ается ли
испытуемый с каж дой задачей как с отдельным случаем или участвует в
задаче с многократным прогнозированием. Значительные сведения из ис­
следований вероятности и похож их задач показываю т, что люди имеют тен­
денцию уравнивать распределение критерия при многократных предсказа­
н иях, особенно в присутствии обратной связи исхода. П оскольку люди пы­
таю тся создавать образец прогнозов, который является репрезентативным
распределению исхода, эксперименты, использующ ие повторные оценки с
тем ж е базовым значением производят большие эффекты базового значе­
н и я, чем эксперименты, в которы х с каж дой оценкой обращ аются как с от­
дельной задачей. (См. B ar-H illel и Fischhoff, 1981; M anis и другие, 1980).
Д ругая интересую щ ая нас процедурная переменная - это различие меж ­
ду внутригрупповы м и меж групповы ми планами. Н апример, Ф ишхтоф,

* Т. е. при положительном диагнозе болезнь отсутствует у 5% людей.


Очевидное воздействие базового значения 181
Словик и Лихтенш тейн (Fischhoff, Slovic и L ichtenstein (1979)) показали,
что данные базового значения имеют больше воздействия, когда они раз­
личны в разны х задачах, предоставленных каждому испытуемому, чем ког­
да различны е базовые пропорции предоставлены различны м испытуемым.
Внутригрупповой план, однако, стимулирует общую тенденцию приписы ­
вать больший вес варьирующемуся признаку, даж е, когда он не соответству­
ет нормативно (Fischhoff и B ar-H illel, 1980). Дальнейш ее обсуждение раз­
личий между внутри- и межгрупповыми планами и их прилож ение для ис­
следования статистических убеждений смотри в гл. 34.
Х отя процедурные переменные имеют значительное влияние, данная
глава ограничивается обсуждением доказательны х переменных, которые
управляю т интерпретацией и воздействием данны х базового значения. Оп­
ределенно, мы обращаем внимание на различия между двумя типами базо­
вы х значений, которые мы назовем причинны ми и случайными.

П р и ч и н н ы е и с л у ч а й н ы е б а зо в ы е з н а ч е н и я
Базовое значение назы вается причинны м, если оно предполагает существо­
вание причинного ф актора, который объясняет, почему отдельный случай
приведет скорее к этому исходу, чем другой. Базовое значение назы вается
случайны м, если оно не ведет к такому выводу.
Я ркая демонстрация контраста между причинны ми и случайными базо­
выми значениями была представлена Айзеном (A jzen, 1977). В одном экс­
перименте, респонденты оценили вероятность того, что студент, академи­
ческая успеваемость которого бы ла кратко описана, успешно сдал отдельно
взяты й экзамен. Причинное базовое значение было представлено следую­
щ им образом:
Два года назад сдавался заключительный экзамен в Йельский университет. Приблизи­
тельно 75% студентов потерпели неудачу (успешно сдали) экзамен.

Это базовое значение является причинным, потому что оно подразумева­


ет, что экзамен был исключительно труден (если 75% студентов потерпели
неудачу) или относительно легкий (если 7 5% студентов сдали его). Выведен­
ная причина (то есть, трудность экзамена) “объясняет” базовое значение и
делает менее (более) вероятным то, что каж ды й студент сдаст экзамен.
Случайное базовое значение было представлено следующ им образом:
Два года назад, в Йельском университете сдавался заключительный экзамен. Психо­
лог-педагог, интересующийся успеваемостью, опросил большое количество студентов,
которые прошли курс обучения. Так как он был, прежде всего, заинтересован в реак­
циях на успех (неудачу), он выбирал главным образом студентов, которые успешно сдали
(потерпели неудачу) экзамен. В частности, приблизительно 75% студентов в его выбор­
ке успешно сдали (провалили) экзамен.

Это базовое значение является случайны м, или не-причинным, потому


что пропорция студентов, сдавш их экзамен или нет, в выборке была наугад
182 ПРИЧИННОСТЬ И АТРИБУЦИЯ
отобрана исследователем. В отличие от базового значения, она не позволяет
сделать вывода относительно трудности экзамена.
Исследование А йзена (1977) показало, что причинное базовое значение
обладало большим весом, чем случайное, хотя оба типа базового значения
оказали существенное влияние. Д ля причинного базового значения, оценен­
н ая вероятность успеха (средний по всем описаниям) бы ла выш е 0.34, при
большом значении базового значения успеха, чем при низком. Д ля случай­
ного базового значения соответствующее различие было только 0.12. В тер­
минах данного анализа, легкость или трудность экзам ена - одна из способ­
ствующ их причин, которые затрагиваю т поведение студента, и поэтому свя­
зана с другими причинами, таким и к а к уровень интеллекта и мотивирован­
ность рассматриваемого студента.
Базовое значение успеха использовалось в предшествующем исследовании,
чтобы определить экзамен к ак легкий или трудный. Во втором исследовании,
базовое значение предпочтения использовалось, чтобы определить выборы как
более или менее привлекательные (Ajzen, 1977). Испытуемых попросили оце­
нить вероятность, что студенты, чьи краткие описания личности прилагались,
выберут в качестве факультативного курса или историю, или экономику.
Причинное базовое значение, которое служило для определения относитель­
ной привлекательности одного из этих двух выбора, состояло и з пропорции
студентов, зарегистрированных на этих двух курсах(0.70и 0.30). Случайное
базовое значение было представлено следующим образом:
Чтобы узнать мнение студентов, профессор истории (экономики) недавно опросил 70
студентов, которые проходили его общий курс по истории (экономике), для сравнения,
он также опросил 30 студентов, которые прошли курс экономики (истории).

Обратите внимание, что, в отличие от причинного базового значения, слу­


чайное не дает информации относительно популярности этих двух курсов.
В лияние случайного базового значения не было сущ ественным в этом ис­
следовании, хотя имелось различие вероятности 0.025 в ожидаемом направ­
лении. Н апротив, причинное базовое значение имело сильное влияние: сред­
н яя оцененная вероятность выбора бы ла 0.65 для популярного курса (высо­
кое базовое значение) и 0.36 для непопулярного курса (низкое базовое зна­
чение). Очевидно, привлекательность курсов выведена из базовых значений
выборов и объединена с личны ми характеристиками при оценке вероятнос­
ти того, что отдельный студент выберет скорее один курс, чем другой. С нор­
мативной точки зрения, однако, и причинное, и случайное базовое значе­
ние в этих примерах должны иметь едва сопоставимые влияния.
Наш следующ ий пример иллю стрирует другой тип причинного базового
значения; оно такж е позволяет вы числить правильную апостериорную ве­
роятность согласно некоторым разумны м предполож ениям. Рассмотрим
следующую измененную версию задачи про такси, первоначально представ­
ленную Канеманом и Тверским (1972а) и позж е исследованную Бар-Хил-
лел (1980а), и Тверским и Канеманом (1980,8).
Очевидное воздействие базового значения 183
Такси сбило человека и скрылось с места происшествия ночью. Две компании такси,
Зеленая и Синяя, работают в городе. Вам дают следующие данные:
(A) 85% такси в городе - Зеленые и 15% - Синие.
(B) свидетель идентифицировал такси как Синее. Суд проверил надежность свиде­
теля при обстоятельствах, которые существовали в ночь несчастного случая, и зак­
лючил, что свидетель правильно идентифицировал каждый из этих двух цветов в
80% случаев и неправильно в 20% случаев.
Какова вероятность того, что такси, сбившее человека было скорее Синим, чем Зеле­
ным?

Чтобы получить правильны й ответ, пусть В и G обозначают соответствен­


но гипотезы , что такси, сбившее человека, Синее или Зеленое, и пусть W -
сообщение свидетеля. В соответствии с правилом Байеса в вероятностной
форме, с предш ествующ ей вероятностью 15/85 и отношением вероятности
80/2 0 ,

Р (В/W ) /Р (G /W ) = Р (W /В ) Р (В) / Р (W /G ) Р (G) =


= (0.8) (0 .1 5 )/ (0.2) (0.85) = 1 2 /1 7

и , следовательно

Р (В/W ) = 12 / (12 + 17) = 0 .4 1

Поэтому, несмотря на сообщение свидетеля, такси, сбившее человека,


будет скорее Зеленое, чем Синее, потому что базовое значение является бо­
лее крайним , чем свидетельское показание вероятным.
Большому количеству испытуемых предоставили несколько отличающие­
ся версии этой задачи с очень последовательными результатами. Средний и
модальный ответ - 0.80, значение, которое совпадает с достоверностью сви­
детельского показания и , очевидно, не зависит от относительной частоты
Синих и Зелены х такси.
И нформация базового значения, однако, использовалась в отсутствии
целевых данны х. Когда пункт (Ь) был опущен из вопроса, почти все тести­
руемые дали основное значение (0.15) к ак ответ. Кроме того, базовое значе­
ние управляло ожиданием испытуемых относительно свидетельских дан­
ны х. Другой группе испытуемых бы ла предоставлена вы ш еупомянутая за­
дача за исключением того, что предложение “свидетель определил такси,
как Синее” было заменено на “свидетель определил цвет такси”. Затем этих
испытуемых спросили, “какова вероятность, что свидетель определил так­
си как Синее?” Средний и модальный ответ на этот вопрос был 0.15. Обрати­
те внимание, что правильны й ответ- 0 .2 х 0.85 + 0.8 х 0 .1 5 = 0 .2 9 . Вотсут-
ствии других данны х, знание базового значения использовалось должным
образом, чтобы спрогнозировать целевой исход и ненадлежащ им образом,
чтобы спрогнозировать сообщение свидетеля.
184 ПРИЧИННОСТЬ И АТРИБУЦИЯ
Другой вид суждений наблюдался, когда случайное базовое значение (так­
си) было заменено причинным базовоым значением (несчастных случаев).
Это было сделано путем замены пункта (а) на:
(а’) Хотя эти две компании приблизительно равны в размере, 85% несчастных случаев
с такси в городе произошло с Зелеными такси и 15% — с Синими.

Ответы на эту задачу были различны ми, но базовое значение больше не


игнорировалось. Средний ответ был 0.60, что находится между достоверно­
стью свидетельского показания (0.80) и правильным ответом (0.41). Базо­
вое значение в случае (а) является причинны м, потому что различие в про­
порциях несчастных случаев между компаниями равного размера легко вы­
являет вывод, что водители Зеленых такси менее осторожны или менее ком­
петентны , чем водители Синих такси. Этот вывод объясняет дифференци­
альны е базовые значения несчастных случаев и подразумевает, что любое
Зеленое такси, более вероятно, будет вовлечено в несчастный случай, чем
любое Синее такси. Напротив, основное значение в (а) случайно, потому что
различие между количеством Синих и Зеленых такси в городе не делает воз­
можным причинны й вывод, которы й делает более вероятным, что любое
Зеленое такси, а не любое Синее такси попадет в несчастный случай.
Обратите внимание, что согласно данному анализу, последующ ая веро­
ятность, что такси, которое принимало участие в несчастном случае, явл я­
ется, скорее Синим, чем Зеленым - та ж е сам ая и в (а), и в (а’). Однако связь
меж ду цветом такси и причастностью к несчастным случаям равняется 0
для случайного базового значения и 0.7 - для причинного! Этот статисти­
ческий ф акт отраж ает различие меж ду двумя базовыми значениями и по­
могает объяснить, почему причинное базовое значение используется, в то
время к ак случайное базовое значение игнорируется.

Д р у ги е д о к а з а т е л ь н ы е п ер ем ен н ы е
П ричинны й или случайны й характер данных базового значения не един­
ственная доказательная переменная, которая влияет на интуитивные оцен­
ки . Д аж е в отсутствии причинной интерпретации, данные базового значе­
н и я не заменяю тся неопределенными, обедненными или непоследователь­
ными данными случая. Например, Бар-Х иллел (1980а) изучала версию пер­
воначальной задачи с такси, в которой информация относительно свидете­
л я (пункт Ь) бы ла заменена сообщением, что сбившее человека такси было
оборудовано селекторной связью (переговорными устройствами) и что се­
лекторная связь установлена в 80% Зелены х такси и в 20% Синих такси.
В этой задаче, (случайное) базовое значейие не было отвергнуто, и средний
ответ был 0.48. Бар-Х иллел предполож ила, что сведения относительно се­
лекторной связи не заменили базовое значение, потому что они менее опре­
деленные, чем идентиф икация свидетелем. Таким образом, данные базово­
го значения объединяю тся с другими сведениями в двух случаях: если пер­
Очевидное воздействие базового значения 185
вые имеют причинную интерпретацию , или если последние не являю тся
более определенными, чем базовое значение (B ar-H illel, 1980а).
И специф ика, и причинная связь могут помочь объяснить различие м еж ­
ду результатам и Канемана и Тверского (19 7 3 ,4 ), которые обнаружили су­
щественное пренебрежение базовым значением в прогнозировании области
специализации студента на основе краткого описания личности и результа­
тами М акКоли и Ститта (McCauley и S titt, 1978). Когда они обнаружили су­
щественную корреляцию между оцененным базовым значением черт харак­
тера и оцененными вероятностями этих черт при указании национально­
сти, например, вероятность, что человек является практичны м, если он не­
мец. Кроме нескольких процедурных различий, последнее исследование
отличается от первого в трех важ ны х аспектах. Во-первых, испытуемых
просили спрогнозировать скорее относительную частоту (например, пропор­
ция немцев, которые являю тся практичны м и), чем вероятность для инди­
видуального случая. Во-вторых, сведения состояли скорее из принадлеж ­
ности к классу, например, немец, чем детальны х описаний определенного
человека. В-третьих, частоту базового значения черт характера легче при­
чинно интерпретировать, чем частоту базового значения профессий. Обы­
вательские теории личности предлагаю т причины , почему больш инство
людей лю бят повеселиться, и только некоторые из них мазохисты. Эти при­
чины могут объяснить поведение людей вообще и немцев, в частности, та­
ким образом, обеспечивая причинную интерпретацию базового значения
черт характера.
Особенно интересно рассмотреть ситуацию , касаю щ ую ся определенных,
но недиагностических сведений (например, описание человека, одинаково
подобного инж енеру и адвокату). Экспериментальные выводы здесь не пол­
ностью последовательны. Канеман и Тверский (1973, 4) обнаружили пре­
небрежение базовым значением, в то время к ак Джиносар и Троуп (G inosar
и Trope, 1980) обнаружили исклю чительную уверенность в данных базово­
го значения при подобных экспериментальны х условиях. Больш инство ис­
следований, однако, получили промежуточные результаты, где базовое зна­
чение не было отвергнуто, а скорее ослаблено недиагностическими сведени­
ями относительно данного случая (см. например, M anis и другие, 1980; W ells
и H arvey, 1977).

В н утрен н и е и л и вн еш н и е п р и п и с ы в а н и я
Несколько задач с базовым значением, представляющ их особый интерес для
социальных психологов, возникает, когда сведения и базовое значение от­
носятся соответственно к внутренне-поведенческим и к внеш не-ситуатив­
ным ф акторам, которые влияю т на исход. Успех студента на экзамене, на­
пример, определен к ак трудностью экзам ена, так и талантом студента. Точ­
но так ж е ответ на просьбу пожертвовать деньги в благотворительное пред­
приятие зависит к ак от щ едрости дающ его, так и от характера просьбы.
186 ПРИЧИННОСТЬ И АТРИБУЦИЯ
В неш ние ф акторы , таки е к а к трудность экзам ена и ли эф ф ективность
просьбы, естественно, выражены соответствующими базовыми значения­
ми (например, 75% студентов провалили экзамен; большинство людей вне­
сло вклад в благотворительное предприятие). Вопрос об относительном воз­
действии ситуативны х и поведенческих факторов в социальном приписы­
вании, таким образом, мож ет быть повторно сформулирован в терминах
значения, которое придается соответствующим базовым значениям.
Нисбетт и Боргида первыми исследовали связь между использованием
информации базового значения в исследовании оценок и относительным
весом ситуативных факторов в изучении атрибуции поведения. Они пока­
зали, что в исследовании Д арли-Л атана (D arley-Latane, 1968) знание того,
что испытуемые редко оказы вали помощь, не затрагивало прогнозов испы­
туемых относительно поведения отдельного участника исследования, кото­
ры й был показан в кратком интервью, снятом на камеру. Исследование Нис-
бетта и Боргиды (1975) внесло вклад в пересекаемость когнитивны х и соци­
ально-психологических подходов к изучению оценивания. Это такж е выз­
вало противоречие (B orgida, 1978; W ells и H arvey, 1977,1978) и ряд иссле­
дований роли согласованности информации в прогнозировании поведения
(B orgida и Brekke, 1981; K assin, 1979b; N isbett и Ross, 1980; Ross, 1977).
В отличие от примеров с экзаменами и такси, в которы х причинные и
случайны е базовые значения ясно различим ы , базовые значения во многих
исследованиях консенсуса подвержены альтернативным интерпретациям.
Чтобы это проиллю стрировать, давайте сравним исследование Нисбетта и
Боргиды (1975) с причинным условием базового значения в эксперименте
А йзена (A jzen, 1977), где испытуемые оценили вероятность того, что отдель­
но взяты й студент сдаст экзамен, который провалили 75% группы. Фор­
м альная структура двух задач одна и та ж е, но базовым значением в значи­
тельной степени пренебрегали в первом исследовании и использовали в пос­
леднем. К аж ется, что необычному базовому значению давали ситуативную
интерпретацию в исследовании А йзена, но оно интерпретировалось к ак слу­
чайное формирование выборки в исследовании Нисбетта-Боргиды.
Оценки испытуемых А йзена указы ваю т, что они вывели из низкого ба­
зового значения успеха, что экзамен был труден, хотя они могли использо­
вать те ж е самые сведения, чтобы прийти к выводу, что студенты, которые
проходили тест, не были достаточно умными. Н апротив, испытуемые Нис­
бетта и Боргиды , очевидно приш ли к выводу, что участники исследования
об оказании помощи были главны м образом бесчувственными и жестокими
людьми (W ells и H arvey, 1977). Они не приш ли к правильному заклю че­
нию , что ситуация исследования Д арли-Л атана не располагала к проявле­
нию помощи.
П риписано ли экстремальное базовое значение случайному формирова­
нию выборки или ситуативным ф акторам, зависит от контекста проблемы:
более вероятно, что необычное распределение результатов тестов возникло
из-за сложности (или легкости) экзамена, чем из-за необычного состава груп­
Очевидное воздействие базового значения 187
пы. С другой стороны тяж елее пересмотреть концепцию относительно ус­
ловий, при которы х люди помогают незнакомому человеку, которого хва­
тил удар, чем предположить, что участники исследования об оказании по­
мощи были исклю чительно бессердечными.
Очевидное пренебрежение данными базового значения в прогнозах от­
дельных случаев связано с выводом относительно необычных характерис­
тик членов группы. П ричинная интерпретация базового значения становит­
ся более вероятной, если этот вывод блокирован. Эта гипотеза была поддер­
ж ана несколькими исследованиями, которые восстановили эффект вл и я­
ния базового значения, подчеркивая репрезентативность выборки, в кото­
рой наблюдалось необычное поведение (H ansen и Donoghue, 1977; H ansen и
Lowe, 1976; W ells и H arvey, 1978). Воздействие данны х базового значения
было даж е увеличено в одном исследовании, сообщая испытуемым, что вы ­
борка, для которой давались базовые значения, бы ла большой и поэтому
надежной (K assin, 1979а). Главное заклю чение этого и сследован ия-то, что
использование или пренебрежение согласованностью информации в отдель­
ном прогнозе критически зависит от интерпретации этой информации.
Часть IV
Доступность
11. Доступность: эвристика оценки частоты
и вероятности*

Амос Тверски иДаниель Канеман

В вед ен и е
Больш инство недавних исследований были посвящ ены проблемам валид­
ности и последовательности оценок вероятности и частоты. Однако извест­
но мало о психологических механизмах, с помощью которых люди оцени­
вают частоту классов или вероятность событий.
Мы предполагаем, что при столкновении с трудной задачей оценки веро­
ятности или частоты, люди используют ограниченное количество эвристик,
которые сокращ аю т эти оценки до более простых. Ранее мы проанализирова­
ли подробно одну из таких эвристик - репрезентативность. С помощью этой
эвристики, событие оценивается к ак вероятное настолько, насколько оно
представляет существенные особенности своей родительской совокупности
или процесса, породившего его....
При оценке вероятности события с помощью репрезентативности, чело­
век сравнивает существенные особенности события со структурой, из кото­
рой оно исходит. Таким образом, человек оценивает вероятности, оценивая
подобие или коннотативное расстояние. С другой стороны, можно оценить
вероятность, используя доступность, или ассоциативное расстояние. Из ж и з­
ненного опыта мы знаем, что частные случаи больших классов вспомина­
ются лучш е и быстрее, чем случаи менее часты х классов, что вероятные со­
бытия легче вообразить, чем маловероятные, и что ассоциативные связи уси­
ливаю тся, когда два события часто происходят одновременно. Таким обра­
зом, человек мог оценить численность класса, вероятность события или ча­
стоту взаимосвязанны х появлений событий, оценивая легкость, с которой
мож ет быть выполнено соответствующее умственное действие формирова­
ния вы борки, построения или ассоциации.

*Эта глава - сокращенная версия работы, которая появилась в Cognitive Psychology, 1973,
4,207-232. Авторское право© 1972 Academic Press, Inc. Переиздано в соответствии с разре­
шением
192 ДОСТУПНОСТЬ
Например, можно оценивать пропорцию разводов в данном обществе, вспо­
м иная разводы среди знакомых; можно оценивать вероятность того, что по­
литический деятель проиграет на выборах, рассматривая различные спосо­
бы, с помощью которых он может потерять поддержку; и можно оценивать
вероятность того, что жестокий человек “увидит” хищ ных зверей в карточ­
ках Рорш аха, оценивая силу ассоциации между насилием и хищ никами. Во
всех этих случаях, оценка частоты класса или вероятности случая опосредо­
вана оценкой доступности1. Считается, что человек использует эвристику
доступности всякий раз, когда он оценивает частоту или вероятность за счет
легкости, с которой события или ассоциации могут прийти ему в голову. Что­
бы оценить доступность, совсем не обязательно выполнять фактические дей­
ствия формирования выборки или построения. Достаточно оценить легкость,
с которой эти действия могли быть выполнены, подобно тому, как трудность
загадки или математической задачи может быть оценена без рассмотрения
определенных решений.
То, что ассоциативные связи усиливаются при повторении - возможно, са­
мы й стары й закон запом инания, известный человеку. Эвристика доступно­
сти использует обратную форму этого закона, то есть она использует силу
ассоциации к ак основание для оценки частоты. В этой теории, доступность
является, скорее, переменной-посредником, чем зависимой переменной как
обычно бывает в исследовании пам яти. Доступность - надеж ны й клю ч для
оценки частоты, потому что, часты е события легче вспомнить или вообра­
зить, чем редкие. Однако на доступность такж е воздействуют различные
ф акторы , которые не связаны с фактической частотой. Если применяется
эвристика доступности, то такие ф акторы повлияю т на воспринятую часто­
ту классов и субъективную вероятность событий. Следовательно, использо­
вание эвристики доступности ведет к систематическим предубеждениям.
Эта часть книги исследует эвристику доступности в десяти последователь­
ны х исследованиях.26*Сначала мы показы ваем, что люди могут оценивать
доступность с разумной скоростью и точностью. Затем, мы показы ваем, что
оцененная частота классов смещ ается за счет доступности их частных слу­
чаев для построения и процесса формирования воспроизведения. Экспери-

1 Настоящее использование термина “доступность” не совпадает с некоторыми случаями


употребления этого термина в литературе по исследованию речи (см., например, Horowitz,
Norman и Day, 1966; Tulving и Pearlstone, 1966).
2 Приблизительно 1500 испытуемых участвовали в этих исследованиях. При отсутствии
дополнительной информации, исследования проводились в группах из 20-40 испытуемых.
Испытуемые в исследованиях 1, 2, 3, 9 и 10 были привлечены рекламными объявлениями
в студенческой газете в Университете штата Орегон. Испытуемые в исследовании 8 были
подобным образом привлечены в Университете Стэнфорд. Испытуемые в исследованиях 5,
6 и 7 были учащимися в 10-ых и 11-ых классов нескольких среднеобразовательных школ-
колледжей в Израиле.
Доступность: эвристика оценки частоты ... 193
ментальные исследования этой части книги касаются оценок частот или
вероятностей, которые могут легко уменьшены до относительных частот.
Влияние доступности на оцененные вероятности по существу уникальных
событий (которые не могут быть уменьшены до относительных частот) об­
суждены в пятой и заключительной главе.

О ц ен ки д о сту п н о сти
Исследование 1: Построение
Испытуемым (N = 42) предоставлен ряд задач на построение слов. К аж дая
задача состояла из матрицы 3 x 3 , содержащих девять букв для составле­
ния слов из трех букв или больше. В обучающей стадии исследования, всем
испытуемым предоставили шесть задач. На каждую задачу, им давали 7
секунд, чтобы оценить количество слов, которые они могли бы составить за
2 минуты. После каждой оценки, им давали две минуты, чтобы записать (в
пронумерованных строках) столько слов, сколько они могли составить из
букв в матрице. Данные, полученные в обучающей стадии, были исключе­
ны. В стадии испытания, построение и задачи оценивания были отделены.
Каждый испытуемый, оценивал для восьми задач количество слов, которое
он мог бы придумать за 2 минуты. Д ля восьми других задач, он составлял
слова без предшествующей оценки. Оценивание и задачи построения чере­
довались. Использовались два параллельных стимульных проспекта, что­
бы для каждой задачи половина испытуемых оценивала и половина состав­
ляла слова.
Результаты. Среднее количество составленных слов варьировалось от 1.3
(для XUZONLCJM) до 22.4 (для TAPCERHOB), с общим средним 11.9. Сред­
нее оцененное число варьировалось от 4.9 до 16.0 (для тех ж е самых двух
задач), с общим средним 10.3. Корреляция между оценкой и продуктивно­
стью по этим шестнадцати задачам составила 0.96.

Исследование 2: Воспроизведение
Структура и процедура были идентичны исследованию 1, за исключением
характера задачи. Здесь, каж дая проблема состояла из категории, напри­
мер, цветы или русские писатели, частные случаи которых необходимо
было вспомнить. Испытуемым (N = 28) давали 7 секунд на то, чтобы оце­
нить количество частных случаев, которые они могли вспомнить за 2 мину­
ты, или 2 минуты на то, чтобы фактически вспомнить. Как в исследовании 1,
задачи построения и оценивания были объединены в обучающейся стадии
и чередовалось в стадии испытаний.
194 ДОСТУПНОСТЬ
Результаты. Среднее количество случаев варьировалось от 4.1 (названия
городов начинающиеся на букву Ф) до 23.7 (четвероногие животные), с об­
щим средним 11.7. Среднее оцененное число варьировалось от 6.7 до 18.7 (для
тех ж е самых двух категорий), с общим средним 10.8. Корреляция между
продуктивностью и оцениванием по этим 16 категориям была 0.93.

Обсуждение
В вышеупомянутых исследованиях, доступность событий могла быть изме­
рена общим количеством выбранных или созданных случаев в любой зада­
че.3Исследования показывают, что люди могут быстро и точно оценивать
доступность. К ак такие оценки осуществляются? Один вероятный механизм
предложен в работе Боусфилда и Седжевика (Bousfield & Sedgewick, 1944),
которые показали, что совокупное воспроизведение случаев является отри­
цательно ускоренной показательной функцией от времени. Испытуемый мог
использовать количество случаев, выбранных в короткий промежуток вре­
мени, чтобы оценить количество случаев, которые он мог выбрать в дли­
тельный отрезок времени. С другой стороны, испытуемый может оценивать
доступность без явного воспроизведения или построения случаев вообще.
Х арт (H art, 1967), например, показал, что люди могут точно оценивать свою
способность узнавать предметы, которые они не могут вспомнить в тесте на
запоминание парных ассоциаций.

Д о с ту п н о с ть д л я п о с т р о е н и я
Мы обратимся теперь к ряду проблем, в которых испытуемому дают прави­
ло для построения случаев и просят оценить их общую (или относительную)
частоту. В этих задачах - к а к в большинстве задач на оценивание, испыту­
емый не может создать и перечислить все случаи. Вместо этого, мы предпо­
лагаем, он пытается создавать некоторые случаи и оценивает полную часто­
ту степенью доступности, то есть в соответствии с оценкой легкости, с кото­
рой случаи могут прийти в голову. К ак следствие, классы явлений, случаи
которых легко создать или вообразить, будут восприниматься к а к более ча­
стые, чем классы того ж е самого размера, которые менее доступны. Этот
прогноз проверен на оценке частоты слова и на оценке нескольких комби­
наторных выражений.

3 Проблемы построения слова могут также рассматриваться как проблемы воспроизведе­


ния, потому что слова-ответы существуют в памяти. В этой части книги мы говорим о вос­
произведении, когда тестируемый вспоминает случаи естественной категории, как в иссле­
дованиях 2 и 8. Мы говорим о построении, когда испытуемый производит образцы согласно
указанному правилу, как в исследованиях 1 и 4.
Доступность: эвристика оценки частоты ... 195
И сследование 3: Оценка частоты слова
Предположим, Вы выбрали наугад слово из английского текста. Что более
вероятно, что слово начинается на К , или что К - его третья буква? Соглас­
но нашему предположению, люди отвечают на такой вопрос, сравнивая до­
ступность этих двух категорий, то есть, оценивая легкость, с которой слу­
чаи этих двух категорий приходят на ум. Конечно, легче придумать слова,
начинающиеся с К, чем слова, где К является третьей буквой. Если оценка
частоты опосредована оцененной доступностью, то слова, начинающиеся на
К, должны быть оценены как более частые. На самом деле, обычный текст
содержит вдвое больше слов, в которых К находится в третьей позиции, чем
слов, начинающ ихся на К.
Согласно обширному подсчету слов Майцнера и Тресселта (Mayzner и
Tresselt, 1965), существует восемь согласных, которые встречаются чаще в
третьей, чем в первой позиции. Из них, две согласные (X и Z) относительно
редки, а другая (D) часто встречается в третьей позиции только в словах из
трех букв. Оставшиеся пять согласных (К, L, N, R, Y) были отобраны для
исследования.
Испытуемым дали следующие инструкции:
Изучалась частота появления букв в английском языке. Был отобран обычный текст,
была зарегистрирована относительная частота появления различных букв алфавита в пер­
вой и третьей позициях слов. Слова, состоящие менее, чем из трех букв, были исключе­
ны из подсчета.
Вам предложат несколько букв алфавита и попросят оценить, появляются ли эти буквы
чаще в первой или в третьей позиции, и оценить отношение частоты, с которой они появ­
ляются в этих позициях.

Типичная задача, была следующей:


Рассмотрите букву Р. Что более вероятно, что Р появится в
- Первой позиции?
- Третьей позиции?
Моя оценка соотношения этих двух величин : 1.

Испытуемых проинструктировали, чтобы они оценили отношение больше­


го класса к меньшему. Д ля половины испытуемых, упорядочение этих двух
позиций в вопросе было изменено. Кроме того, использовались три различ­
ных порядка этих пяти букв.
Результаты. Среди 152 испытуемых, 105 оценили, что первая позиция бо­
лее вероятна для большинства букв и 47 оценили, что - третья. Предубеж­
дение в пользу первой позиции является существенным (р < 0.001, тест зна­
ков). Кроме того, по оценке большинства испытуемых, каж дая из пяти букв
появлялась чаще в первой, чем в третьей позиции. Отношение средней оцен­
ки было 2:1 для каждой из этих пяти букв. Эти результаты были получены,
несмотря на тот факт, что все буквы встречались чаще в третьей позиции.
196 ДОСТУПНОСТЬ
В других исследованиях мы обнаружили то ж е предубеждение в пользу
первой позиции при внутригрупповом плане исследования, где каж ды й ис­
пытуемый оценивал отдельную букву, и при межгрупповом плане, где час­
тоты букв в первой и в третьей позициях были оценены различными испы­
туемыми. Мы такж е наблюдали, что вознаграждение за точность в первом
проекте не имело никакого влияния. Так к ак во всех методах был получен
сходный характер результатов, мы приводим только результаты, получен­
ные в соответствии с самой простой процедурой.
О подобном результате было сообщено Филлипсом (Phillips, 1966) в ис­
следовании вывода Байеса. Шесть редакторов студенческих газет оценива­
ли вероятности, что различные двухбуквенные сочетания (биграммы), ото­
бранные из собственных записей, были взяты с начала или с конца слов.
Дополнительный эффект, наблюдаемый в этом исследовании, показал, что
все редакторы были предубеждены в пользу гипотезы, согласно которой двух­
буквенные сочетания были взяты с начала слов. Например, редакторы оши­
бочно оценили слова, начинающиеся с “ге”, более частыми, чем слова, закан­
чивающиеся на “ге”. Первые, конечно, являю тся более доступными, чем пос­
ледние.

И сследование 4: П ерест ановки


Рассмотрим две структуры, А и В, которые показаны ниже.
(А) (В )
хххххххх XX
хххххххх XX
хххххххх XX
XX
XX
XX
XX
XX
XX

Дорожка в структуре — это линия, которая соединяет элемент в верхней строке с эле­
ментом в нижней строке, и пересекает только один элемент в каждой строке.
В какой из двух структур больше дорожек?
Сколько дорожек, по вашему мнению, имеется в каждой структуре?

Большинство читателей, вероятно, разделят непосредственное впечатление,


что в А больше дорожек, чем в В. Наши испытуемые приш ли к такому же
выводу: 46 из 54 испытуемых увидели большее количество дорожек в А,
чем в В (р < 0.001, тест знаков). Средние оценки были 40 дорожек в А и 18 в
В. Ф актически, количество дорожек - одинаковое в обеих структурах, так
к а к 83 = 29 = 5 12.
Доступность: эвристика оценки частоты ... 197
Почему люди видят больше дорожек в А, чем в В? Мы предполагаем, что
этот результат отражает различную доступность дорожек в двух структурах.
Существуют несколько факторов, которые делают дорожки в А более доступ­
ными, чем в В. Во-первых, наиболее доступные дорожки - столбцы структур.
В А есть 8 столбцов, а в В только 2. Во-вторых, дорожки, пересекающие столб­
цы в А вообще более различимы и меньше запутаны, чем в В. Две дорожки в А,
в среднем, пересекают 1/8 их элементов, в то время как две дорожки в В, в сред­
нем, пересекают половину их элементов. Наконец, дорожки в А короче и, сле­
довательно, легче воспринимаются на глаз, чем дорожки в В.

Исследование 5: Комбинации
Рассмотрим группу из десяти человек, которые должны сформировать ко­
митеты из г членов, где г - некоторое число между 2 и 8. Сколько различных
комитетов из г членов они могут сформировать? Правильный ответ на эту
задачу задается биномным коэффициентом (г10), который достигает макси­
мума 252 для г = 5. Ясно, что количество комитетов из г членов равняется
числу комитетов из 10 - г членов, потому что любая выбранная группа, ска­
жем, из двух членов определяет единственно возможную невыбранную груп­
пу из восьми членов.
Согласно нашему анализу интуитивной оценки, однако, комитеты из двух
членов более доступны, чем комитеты из восьми. Во-первых, самая простая
схема построения комитетов - разделение группы на непересекающиеся под­
множества. Таким образом, каж ды й с легкостью видит, что существуют
целых пять непересекающихся комитетов из двух членов, но не видит и двух
непересекающихся комитетов из восьми. Во-вторых, комитеты из восьми
членов намного менее различимы, так как их элементы пересекаются; лю­
бые два комитета из восьми имеют, по крайней мере, шесть общих членов.
Этот анализ предполагает, что маленькие комитеты более доступны, чем
большие комитеты. В соответствии с гипотезой доступности, поэтому, м а­
ленькие комитеты должны казаться более многочисленными.
Четыре группы испытуемых (общее количество N = 118) оценили коли­
чество возможных комитетов из г членов, которые могут быть сформирова­
ны из десяти человек. Различные группы, соответственно, оценили следу­
ющие значения г: 1 и 6; 3 и 8; 4 и 7; 5.
Средние оценки количества комитетов показаны на Рисунке 1, с правиль­
ными значениями. Как и было спрогнозировано, оцененная численность ко­
митетов уменьшается с их размером.
Следующая альтернативная формулировка той ж е самой задачи была изоб­
ретена, чтобы проверить общность результатов:
В рисунке, приведенном ниже, имеются десять станций по маршруту между Стартом и
Финишем. Рассмотрим автобус, который следует по этому маршруту, останавливаясь
точно на г станциях.
198 ДОСТУПНОСТЬ

СТАРТ I I I I I I » I I I 1 ФИНИШ

Сколько различных вариантов г остановок автобус может делать?

Количество различных образцов г остановок снова (г10). Здесь такж е коли­


чество вариантов двух остановок такое ж е, что и количество вариантов вось­
ми остановок, потому что для любого варианта остановок имеется единствен­
но возможный дополнительный вариант не-остановок. Все же, человек ока­
зывается более свободен в построении образцов двух остановок, где “суще­
ствует много станций, из которых можно выбирать”, чем в построении об­
разцов восьми остановок, где “нужно останавливаться почти на каждой ос­
тановке.” Наш предыдущий анализ предполагает, что первые образцы бо­
лее доступны: большее количество таких образцов замечается с первого
взгляда, они более отличительны и их легче визуализировать.

250
200
150
100
X 90
X
80
г
X 70
X
>о 60
X 50
О
* 40
30

20

10
- I— I— I— I— I— I— ^

2 3 4 5 6 7 8

Размер набора

Рис. 1. Правильные величины и средние оценки (на логарифмичес­


кой шкале) для задачи про комитеты и остановки

Четыре новых группы испытуемых (общее количество N = 178) ответили


на этот вопрос, для г = 2 ,..., 8 по тому ж е образцу, к ак указано выше. Сред­
ние оценки количества остановок показаны на Рисунке 1. К ак и в задаче
про комитеты, очевидное количество комбинаций вообще уменьшается с г,
в соответствии с прогнозом гипотезы доступности, и в заметном несоответ­
ствии с правильным величинами. Оценки количества комбинаций подоб­
ны в двух задачах. К ак в других комбинаторных задачах, существует явная
Доступность: эвристика оценки частоты ... 199
недооценка всех правильных величин, с единственным исключением в наи­
более доступном случае, где г = 2.
Недооценка, наблюдаемая в экспериментах 4 и 5 происходит потому, что
люди оценивают комбинаторные величины, экстраполируя от начального
впечатления. То, что человек видит сразу или в нескольких шагах вычисле­
ния, дает ему неправильную идею относительно неограниченно возрастаю­
щей пропорции роста многих комбинаторных выражений. В таких ситуаци­
ях, экстраполирование от начального впечатления ведет к явной недооцен­
ке. Дело в том, является ли основание для экстраполяции изначальной дос­
тупностью случаев, как в предшествующих двух исследованиях или резуль­
татом изначального вычисления, как в следующем исследовании.

И сследование 6: Экст раполяция


Мы попросили, испытуемых оценить, в пределах 5 секунд, числовое выра­
жение, которое было написано на доске. Одна группа испытуемых (N = 87)
оценивала выражение 8 х 7 х 6 х 5 х 4 х З х 2 х 1 , в т о время к ак другая группа
(N = 114) оценила выражение 1 х 2 х З х 4 х 5 х 6 х 7 х 8 . Средняя оценка для
убывающей последовательности была 2. 250. Средняя оценка для возраста­
ющей последовательности была 512. Различие между оценками высоко су­
щественно (р < 0.001, тест медианы). Обе оценки далеки от правильного от­
вета 40. 320.
И недооценка правильной величины, и различия между двумя оценка­
ми поддерживает гипотезу, согласно которой, люди оценивают 8!, экстра­
полируя от частичного вычисления. Ф акториал, подобно другим комбина­
торным вы ражениям, характеризуется постоянно увеличивающейся про­
порцией роста. Следовательно, человек, который экстраполирует от частич­
ного вычисления, чрезвычайно недооценит факториалы. Поскольку резуль­
таты первых шагов умножения (выполненных слева направо) больше в нис­
ходящей последовательности, чем в возрастающей последовательности, пер­
вое выражение оценено большим, чем последнее. Оценка нисходящей пос­
ледовательности может происходить следующим образом: “8 х 7 - 56 умно­
ж ить на 6 - уж е больше 300, так что, мы имеем дело с достаточно большим
числом.” В оценке возрастающей последовательности, с другой стороны,
можно рассуждать: “1 x 2 равняется 2, умножить на 3 равняется 6, умно­
жить на 4 - 24, это выражение не очень больш ое.... ”

И сследование 7: Бином - доступность или репрезент ат ивност ь


Заключительное исследование этой главы исследует роль доступности в
оценке биноминальных распределений и иллюстрирует, к а к формулиров­
ка задачи управляет выбором эвристики, которую люди принимают при
интуитивной оценке.
200 ДОСТУПНОСТЬ
Испытуемым (N - 73) предоставили следующие инструкции:
Рассмотрите следующую диаграмму:
ХХОХХХ
ХХХХОХ
ХОХХХХ
хххохх
хххххо
оххххх
Дорожка в этой диаграмме - любая нисходящая линия, которая начинается в верхней
строке, заканчивается в нижней строке и проходит точно через один символ (X или О) в
каждой строке.
Как Вы думаете, какой, процент дорожек содержат
6 - X и без - О __%
5 - X и 1 -0 ____ %

без -Х и 6 - 0 ____ %

Обратите внимание, что они включают все возможные типы дорожек и, следовательно,
Ваши оценки должны в сумме составить 100%.

• Данные дорожек
о Правильное значение
Ö \
30% .

\ ,
X
S’ \ h
§. 20% -
ч
10%

+ +
бх 5х 4х Зх 2х 1х Ох

Число X в выборке из 6

Рис. 2. Правильные значения и средние оценки: задача про дорож­


ки
Доступность: эвристика оценки частоты ... 201
Ф актическое распределение типа дорож ки биноминально с р= 5 /6 и
п —6. Люди, конечно, не могут ни угадать правильные ответы, ни перечис­
лить все соответствующие случаи. Вместо этого, по нашему предположению,
испытуемые посмотрят на диаграмму и оценят относительную частоту к а ж ­
дого типа дорожки легкостью, с которой отдельные дорожки этого типа мог­
ли быть построены. Так как, на каждой стадии построения дорожки (то есть,
в каж дой строке диаграммы) имеется намного больше X, чем О, легче пост­
роить дорожки, состоящие из шести X, чем дорожки, состоящие, скажем,
из пяти X и одного О, хотя последние, фактически, более многочисленны.
Соответственно, мы спрогнозировали, что испытуемые будут ошибочно оце­
нивать дорожки из 6 X и без О, как наиболее многочисленные.
Средние оценки относительной частоты всех типов дорожек представле­
ны на Рисунке 2, наряду с правильными биноминальными величинами.
Результаты подтверждают гипотезу. Из 73 испытуемых, 54 ошибочно оце­
нили, что существует больше дорожек, состоящих из шести X и О, чем до­
рожек, состоящих из пяти X и одного О, и только 13 оценили последние,
как более многочисленные, чем вышеупомянутые (р < 0.001, тест знаков).
Монотонность субъективного распределения типов дорожек - общее явле­
ние. Мы п олучи ли тот ж е сам ы й результат с разли ч н ы м и величинам и
р ( 4/ 5 и 5/6) и л (5, 6 и 10), и различными представлениями пропорций со­
вокупности (например, четыре X и один О или восемь X и два О в каждой
строке диаграммы дорожек).
Чтобы исследовать устойчивость этого эффекта, мы провели дополнитель­
ное испытание. Пятидесяти студентам старших курсов Стэнфордского уни­
верситета, не имеющим опыта в комбинаторике, предоставили задачу про
дорожки. Здесь, испытуемых не просили оценить относительную частоту,
а просто решить “имеется ли больше дорожек, содержащих шесть X и О или
дорожек, содержащих пять X и О.” Испытуемых опрашивали индивиду­
ально и им обещали поощрение в $ 1 за правильные оценки. Абсолютное
большинство испытуемых (38 из 50, р < 0.001, тест знаков) снова выбрало
первый упомянутый результат как более частый. Ошибочные интуиции,
очевидно, трудно исправляются за счет предоставления денежных вознаг­
раждений.
Мы предположили, что, когда биноминальное распределение представ­
лено к а к диаграмма дорожек, люди оценивают относительную частоту раз­
личных исходов, определяя доступность отдельных дорожек каждого типа.
Этот способ оценки предложен последовательным характером определения
дорожки и иллюстрированным представлением задачи. Рассмотрим альтер­
нативную формулировку этой ж е задачи.
Шесть игроков участвуют в карточной игре. В каждом туре игры, каждый игрок полу­
чает одну карту, взятую наугад из хорошо перетасованной колоды. В колоде, 5/6 карт
помечены X и оставшиеся 1/6 помечены О. При большом количестве туров, какой про­
цент туров, в которых
202 ДОСТУПНОСТЬ
6 игроков получают Х и н и один игрок не получает О__%
5 игроков получают X, и 1 игрок получает О____%
Ни один игрок не получает X и 6 игроков получают О %

Обратите внимание, что здесь включены все возможные исходы и, следовательно, ваши
оценки должны в сумме составить 100 %.

Задача про карты формально идентична задаче про дорожки, но мы намере­


вались выявить другой способ оценивания. В задаче про дорожки, отдельные
случаи были выделены путем демонстрации и пропорции совокупности (то есть,
пропорция X в каждой строке) не была определена. В задаче про карты, с дру­
гой стороны, пропорция совокупности явно задана, и отсутствует упоминание
относительно отдельных случаев. Следовательно, мы выдвигаем гипотезу, что
исходы в задаче про карты будут определены степенью, в которой они репре­
зентативны по отношению к составу колоды, чем доступностью отдельных слу­
чаев. В задаче про карты, исход “пять X и один О” является наиболее репрезен­
тативным, потому что он соответствует пропорции совокупности (см. Kahneman
nTversky, 1972b, 3). По эвристике репрезентативности, этотисходдолженбыть
оценен как более частый, чем исход “шесть X и без О,” вопреки наблюдаемому
образцу оценок в задаче про дорожки. Оценки 71 из 82 испытуемых, которые
отвечали на задачу про карты, подтвердили этот прогноз. В задаче про дорож­
ки, только 13из 73 испытуемых оценили эти исходы таким же образом; разли­
чие между этими двумя версиями значимо (р < 0.001, тест#2).

Число X в выборке из 6

Рис. 3. Правильные значения и средние оценки: задача про карты


Доступность: эвристика оценки частоты ... 203
Средние оценки для задачи про карты представлены на Рисунке 3. Раз­
личие между рисунками 2 и 3 поддерживает гипотезу, что различные пред­
ставления одной и той ж е задачи выявляю т различную эвристику. В част­
ности, частота класса, вероятно, будет оценена степенью доступности, если
выделены отдельные случаи, и репрезентативностью, если существенными
являю тся признаки категории.

Д о сту п н о сть в о п р о и зв е д е н и я
В этой главе мы обсуждаем несколько исследований, в которых испытуемо­
му сначала предоставляют информацию (например, список имен) и потом
просят, оценить частоту объектов данного типа, которые были включены в
сообщение. К ак и в задачах, исследуемых в предыдущей главе, испытуе­
мый не может вспомнить и сосчитать все случаи. Мы предполагаем, что
вместо этого он пытается вспомнить некоторые случаи и оценивает полную
частоту степенью доступности, то есть легкостью с которой случаи прихо­
дят на ум. Как следствие, классы, чьи случаи с легкостью вспоминаются,
будут оценены как более многочисленные, чем классы того ж е размера, чьи
случаи менее доступны. Этот прогноз сначала был проверен в исследовании
оцененной частоты категорий...

И сследование 8: И звест ност ь, частота и вспоминание


Испытуемым предоставили магнитофонную запись списка имен известных
лиц обоих полов. Прослушав список, некоторые испытуемые оценивали,
содержал ли он большее количество имен мужчин или ж енщ ин, другие по­
пытались вспомнить имена в списке. Некоторые из имен в списке были очень
известны (например, Ричард Никсон, Элизабет Тейлор), другие были менее
известны (например, Уильям Фулбрайт, Л ана Турнер). Известные имена
легче вспомнить. Следовательно, если оценки частоты опосредованы оце­
ненной доступностью, то класс, состоящий из известных имен, должен быть
оценен к а к более многочисленный, чем сравнимый класс, состоящий из
менее известных имен.
Были подготовлены четыре списка имен: два списка артистов и два спис­
ка общественных деятелей. К аждый список включал 39 имен и был запи­
сан со скоростью одно имя в 2 секунды. Два списка (один общественных де­
ятелей и один артистов) состояли из 19 имен известных ж енщ ин и 20 имен
менее известных мужчин. Два других списка состояли из 19 имен извест­
ных муж чин и 20 имен менее известных женщ ин. Следовательно, извест­
ность и частота были обратно связаны во всех списках. Имена всех лиц все­
гда позволяли однозначную идентификацию пола.
Испытуемых попросили слуш ать внимательно записанное сообщение.
Каждый из четырех списков был представлен двум группам. После прослу­
ш ивания записи, испытуемых в одной группе просили записать столько
204 ДОСТУПНОСТЬ
имен, сколько они могли вспомнить из списка. Испытуемых в другой груп­
пе попросили оценить, содержал ли список больше имен мужчин или жен­
щин.
Результаты, (а) Вспоминание. В среднем, испытуемые вспомнили 12.3 из
19 известных имен и 8.4 из 20 менее известных имен. Из 86 испытуемых в
четырех группах вспоминания, 57 вопроизвели больше известных, чем не­
известных имен, и только 13 вспомнили меньше известных, чем не очень
известных имен (р < 0.001, тест знаков).
(Ь) Частота. Среди 99 испытуемых, сравнивавш их частоту муж чин и
ж енщ ин в списках, 80 ошибочно оценили класс, состоящий из более извес­
тных имен, к ак более частый (р < 0.001, тест знаков)....

Воспроизведение и построение сценариев


Во всех эмпирических исследованиях, которые были обсуждены в этой час­
ти книги, существовала объективная процедура для перечисления случаев
(например, слова, которые начинаются на К или дорожки в диаграмме), и,
следовательно, каж дая из задач имела объективно правильный ответ. Дру­
гое дело в случаях из реальной ж изни, в которых оцениваются вероятнос­
ти. К аждый случай экономического спада, успешного медицинского воз­
действия или развод, является по существу уникальным, и его вероятность
не может быть оценена простым числом случаев. К ак бы там ни было, эври­
стика доступности может применяться к оценке вероятности таких собы­
тий.
В оценке вероятности, что отдельно взятая пара разведется, например,
можно полагаться на свою память в поисках пары, которая приходит в го­
лову при упоминании этого вопроса. Развод будет казаться возможным, если
разводы распространены среди случаев, которые выбраны таким образом.
В другом случае, можно оценивать вероятность, пытаясь создать истории,
или сценарии, которые ведут к разводу. Правдоподобие таких сценариев
или легкость, с которой они приходят на ум, могут обеспечивать основу для
оценки вероятности. В данной главе, мы обсуждаем роль доступности в та­
ки х оценках, размышляем относительно ожидаемых источников предубеж­
дения и предлагаем некоторые направления дальнейших исследований.
Мы иллюстрируем предубеждения доступности, рассматривая вообража­
емую ситуацию.4Клинический психолог,услышавший жалобу пациента, что
тот утомлен жизнью, задается вопросом, вероятно ли, что этот пациент совер­
шит самоубийство, и может вспомнить подобных пациентов, которых он знал.
Иногда только один случай приходит на ум, возможно, потому что он самый

4 Этот пример был выбран из-за его доступности. У нас нет достаточной причины полагать,
что интуитивные прогнозы биржевых маклеров, спортивных комментаторов, политичес­
ких аналитиков или психологов-исследователей менее подвержены предубеждениям.
Доступность: эвристика оценки частоты ... 205
незабываемый. Здесь, субъективная вероятность может зависеть, прежде все­
го, от подобия между тем событием и рассматриваемым. Если два события
похожи, то человек ожидает повторение прошлого опыта. Когда несколько
случаев приходят на ум, им придается столько значения, насколько они по­
хожи, в существенных особенностях, исследуемой проблеме.
Н асколько уместны отобранные случаи? А нализируя свой прош лый
опыт, клинический психолог вспоминает пациентов, которые подходят дан­
ному случаю, - тех, кто предпринимал попытки самоубийства, или тех, кто
похож н а данный случай и совершал попытки самоубийства? С актуальной
точки зрения, конечно, соответствующий класс - такой класс пациентов,
которые подобны, в некотором отношении, данному случаю, и соответству­
ю щ ая статистика - это частота попыток самоубийства в классе.
Поиск в памяти может осуществляться по другим правилам. Так к ак
попытки самоубийства - драматическое и чрезвычайное событие, пациен­
ты, склонные к самоубийству, вероятно, будут легче запоминаться и вспо­
минаться, чем депрессивные пациенты, которые не предпринимали подоб­
ных попыток. К ак следствие, клинический психолог может вспомнить па­
циентов, склонных к самоубийству, с которыми он сталкивался, и оценить
вероятность попытки самоубийства степенью подобия между этими случа­
ями и данным пациентом. Такой подход приводит к серьезным предубеж­
дениям. К линический психолог, замечающий, что почти все пациенты,
склонные к самоубийству, которых o r может вспомнить, были угнетены,
может прийти к выводу, что пациент, вероятно, совершит самоубийство,
если он показывает признаки серьезной депрессии. С другой стороны, к л и ­
нический психолог может сделать вывод, что самоубийство маловероятно,
если «этот пациент не напоминает ему ни одного случая самоубийства, с ко­
торым он когда-либо сталкивался». Такое рассуждение игнорирует факт,
что только меньшинство депрессивных пациентов совершает попытку са­
моубийства, и возможность, что данный пациент весьма отличен от любого,
с которым он когда-либо сталкивался.
Наконец, клинический психолог мог бы подумать только о пациентах,
которые были к ак депрессивны, так и склонны к самоубийству. Он тогда
оценил бы вероятность самоубийства легкостью, с которой такие случаи,
приходят на ум или степенью, в которой существующий пациент является
репрезентативным этому классу. Это рассуждение, такж е, обладает серьез­
ным недостатком. Тот факт, что существует много депрессивных пациен­
тов, которые предприняли попытку самоубийства, не свидетельствует от­
носительно вероятности, что депрессивный пациент предпримет попытку
самоубийства, и все ж е этот способ оценивания обычен. Несколько исследо­
ваний (Jenkins & W ard 1963; Smedslund, 1963; W ard & Jenkins, 1965) пока­
зали, что случайность между двумя бинарными переменными такими, как
признак и болезнь оценивается частотой, с которой они происходят взаимо­
связано, практически не принимая во внимание случаи, где либо признак,
либо болезнь отсутствовали.
206 ДОСТУПНОСТЬ
Некоторые события воспринимаются настолько уникально, что прошлый
опыт не каж ется уместным при оценке их вероятности. В размышлении о
таких событиях мы часто строим сценарии, то есть, истории, которые ведут
от существующей ситуации к целевому событию. Правдоподобие сценари­
ев, которые приходят на ум, или трудность их создания, служ ит ключом к
оценке вероятности события. Если обоснованный сценарий не приходит на
ум, случай считают невозможным или маловероятным. Если на ум прихо­
дит много сценариев, или если один придуманный сценарий особенно убе­
дителен, рассматриваемый случай каж ется вероятным.
Многие из событий, вероятность которых люди желают оценить, зави­
сят от нескольких взаимосвязанных факторов. Все ж е чрезвычайно трудно
для человеческого ума прочувствовать последовательности изменений не­
скольких взаимодействующих факторов. Мы предполагаем, что в оценке
вероятности сложных событий рассматриваются только самые простые и
наиболее доступные сценарии. В частности, люди будут склонны создавать
сценарии, по которым большинство факторов вообще не изменяется, при­
сутствуют только наиболее очевидные изменения, и взаимодействующие
изменения редки. Из-за упрощенного характера предполагаемых сценари­
ев, исходы компьютерного моделирования процессов взаимодействия час­
то противоречат интуиции (Forrester, 1971). Тенденция рассматривать толь­
ко относительно простые сценарии может иметь особенно существенные
эффекты в ситуациях конфликта. В этом случае, собственное настроение и
планы более доступны, чем планы другого человека. Н елегко принять мне­
ние противника по шахматной доске или полю битвы, вот почему посред­
ственный игрок обнаруживает так много новых возможностей, когда он
меняет сторону в игре. Следовательно, игрок может иметь тенденцию рас­
ценивать стратегию его противника к ак относительно постоянную и не за­
висящ ую от его собственных шагов. Эти соображения говорят, что игрок
восприимчив к ошибке инициативы - тенденции приписывать меньше ини­
циативы и воображения своему противнику, чем себе. Эта гипотеза согла­
суется с выводом поиска приписывания (Jones & N isbett, 1971), согласно
которому люди склонны воспринимать свое поведение к а к отражение из­
меняю щ ихся потребностей окружающей среды, а поведение других - как
отражение черт характера.
Создание сценария накладывает отпечаток на дальнейшее мышление.
Существует много сведений, показывающих, что к ак только некоторая си­
туация воспринимается или интерпретируется определенным образом, ста­
новится чрезвычайно трудно воспринимать ее по-другому (см, например,
B runer & Potter). Таким образом, составление определенного сценария мо­
ж ет препятствовать появлению других сценариев, особенно тех, которые
ведут к другим исходам...
Возможно, наиболее очевидное проявление доступности в реальной ж из­
ни - это влияние случайной доступности случаев или сценариев. Многие
читатели испытали временное увеличение субъективной вероятности несча­
Доступность: эвристика оценки частоты ... 207
стного случая, увидев на обочине перевернутую машину. Подобным обра­
зом, многие замечают усиление субъективной вероятности того, что несчаст­
ный случай или неполадки оборудования спровоцируют начало термоядер­
ной войны после просмотра фильма, ярко описывающего такую возмож­
ность. Сосредоточение внимания на исходе, может увеличить его доступ­
ность, и, следовательно, его каж ущ ую ся вероятность. Люди увлекаются
желаемыми исходами, такими как выигрыш в тотализаторе или крайне не­
ж елательными исходами, к ак крушение самолета. Следовательно, доступ­
ность обеспечивает механизм, согласно которому явления крайней полез­
ности (или бесполезности) могут происходить более вероятно, чем на самом
деле...
12. Эгоцентрические предубеждения в доступности
и атрибуции*

Михаелъ Росс и Фьер Сиколи

Один пример явления, изученного в настоящем эксперименте, знаком прак­


тически каждому, кто проводил исследование совместно с другими. Рассмот­
рим следующее: Вы работали над совместным проектом с другим челове­
ком и поднимается вопрос, кто является “главным автором” (то есть, кто
внес больший вклад в окончательный проект?). Часто каж ется, что вы оба
можете претендовать на это звание. И так к а к Вы убеждены, что Ваш кол­
лега разделяет ваше видение реальности (где существует только одна реаль­
ность), Вы предполагаете, что другой человек пытается использовать Вас.
Иногда такие разногласия улаживаются или их появление предотвращает­
ся использованием правил условного решения, например, правила “алфа­
витного порядка” - любимая уступка тех, чьи фамилии начинаются с букв,
расположенных в верхней части алфавита.
Мы предполагаем, что отдельные участники совместного проекта склон­
ны принимать на себя больше ответственности за результат, чем другие уча­
стники приписывают им. Далее мы предположили, что распределение уча­
стниками ответственности за совместный проект является распространен­
ным явлением. Однако, люди, занимающиеся общим делом, не всегда зна­
ют о расхождении их взглядов, так к ак нет необходимости приписывать
“авторство”, следовательно, универсальность явления не является очевид­
ной. Цель настоящего исследования - оценить, действительно ли эти эго­
центрические восприятия происходят в различных условиях и исследовать
соответствующие психологические процессы.
И зучая основы различного восприятия, мы допускаем, что иногда люди
намеренно себя возвеличивают. Однако вероятно, что восприятие может не
совпадать при отсутствии намеренного обмана. Именно с этой точки зрения
мы и исследуем проблему.

* Выдержки из работы, появившейся в “The Journal of Personality and Social Psychology”,


1 9 79,37,32-336. Авторское право© 1979 American Psychological Association. Переизданов
соответствии с разрешением.
Эгоцентрические предубеждения в доступности... 209
Полные благих намерений участники, для распределения ответственно­
сти за объединенные усилия, пытаются вспомнить вклад, который каж ды й
из них внес в конечный продукт. Однако некоторые аспекты взаимодействия
можно вспомнить легче, или они являю тся более доступными, чем другие.
Кроме того, особенности, которые легко вспоминаются, могут не быть слу­
чайным подмножеством целого. В частности, человек может вспомнить боль­
шую долю собственного вклада, чем смогут другие участники.
Эгоцентрическое предубеждение в доступности информации в памяти, в
свою очередь, может служить причиной необъективного приписывания от­
ветственности за совместный результат. К ак продемонстрировали Тверски
и Канеман (Tversky и Kahneman, 1973,11), люди используют доступность
(“легкость, с которой соответствующие случаи приходят на ум”) к ак осно­
вание для оценки частоты (1973, стр. 209). Таким образом, если входные
данные, воспроизведенные участником самостоятельно, были бы доступны,
люди тогда принимали больше ответственности за совместный результат,
чем другие участники приписывали им.
Существует, по крайней мере, четыре процесса, направленных на увели­
чение доступности собственных вкладов: (а) выборочное кодирование и хра­
нение информации, (Ь) дифференциальная выборка, (с) информационные
различия и (d) мотивационные влияния.

Выборочное кодирование и хранение


По ряду причин, доступность собственных входных данных человека мо­
ж ет быть облегчена дифференциальным кодированием и хранением само-
цроизведенных реакций. Во-первых, собственные мысли людей (относитель­
но того, что они собираются сказать, фантазии т.д.) или действия могут от­
влекать их внимание от вкладов других. Во-вторых, люди могут имитиро­
вать или повторять свои идеи или действия; например, они могут обдумы­
вать свою позицию перед тем, к а к ее высказать и защитить. Следовательно,
их собственные входные данные получают больше “времени на изучение”,
а степень сохранения тесно связана со временем на изучение (Carver, 1972).
В-третьих, вклады людей легче встраиваются в их когнитивную схему, то
есть в уникальное понимание проблемы, основанное на прошлом опыте,
ценностях и так далее. Вклады, которые вписываются в такие существо­
вавшие ранее схемы, сохранятся с большей вероятностью (B artlett, 1932;
B runer, 1961).

Дифференциальное воспроизведение
Предубеждение доступности может такж е являться следствием дифферен­
циального воспроизведения информации из памяти. При распределении
ответственности за исход совместной деятельности важ ны й вопрос для к а ж ­
дого участника может звучать так: “Каков мой вклад?” Участники могут
210 ДОСТУПНОСТЬ
попытаться вспомнить собственные вклады и неуместно использовать ин­
формацию, полученную таким образом, чтобы оценить их относительные
вклады , однако подобная оценка не может быть сделана должным образом
без рассмотрения входных данных других людей.

Информационные различия
Вероятно, существуют различия в доступной для участников информации,
что может спровоцировать эгоцентрическое вспоминание. Люди имеют боль­
ш ий доступ к их собственным внутренним состояниям, мыслям и стратеги­
ям , чем наблюдатели. Кроме того, участники общего дела могут отличаться
по знанию частоты и значения независимых вкладов друг друга. Например,
супервизоры факультета могут знать меньше о количестве времени, усили­
ях или изобретательности, которую студенты вкладывают в выполнение
заданий, проведение анализов данных и написание предварительных про­
ектов работы, чем сами студенты. С другой стороны, супервизоры более ос­
ведомлены о количестве и о важности размышлений, чтения и так далее,
которые они включают в исследование прежде, чем студенты начнут его
выполнять.

М от ивационны е вли ян и я
Мотивационные факторы могут такж е привести к эгоцентрическому пре­
дубеждению о доступности. Чувство собственного достоинства может уве­
личиться, если сосредотачиваться или придавать больше значения, собствен­
ным вкладам. Точно так же озабоченность собственной оперативностью или
контролем может привести людей к тому, чтобы уделить больше внимания
собственным вкладам в совместное дело (см. deCharms, 1968; W hite, 1959).
Предшествующее обсуждение выделяет множество процессов, которые
могут работать на то, чтобы представить собственные вклады более доступ­
ными (и легкими для вспоминания), чем вклады других. Следовательно,
трудно опровергнуть гипотезу, согласно которой воспоминания и приписы­
вания являю тся эгоцентрическими. К ак заметил Гринвалд (Greenwald,
1978), эгоцентрический характер памяти “не является неминуемой прав­
дой . Можно предпринять попытку упорядочивания прошлого опыта, напри­
мер, провести сопоставительную работу, такую к ак написание текста по
истории или индексирование тезауруса “ (с. 4). Кроме того, нам не удалось
найти опубликованные данные, прямо подтверждающие предполагаемое
предубеждение доступности. Наконец, недавние явления в литературе, по­
священной участникам и наблюдателям, каж ется, противоречат гипотезе,
согласно которой воспоминания и приписывания являю тся эгоцентричес­
кими. Джонс и Нисбетт (Jones и N isbett, 1971) считали, что участники склон­
ны видеть причину своего поведения в окружающей среде, в то время как
наблюдатели приписывают то ж е самое поведение устойчивым чертам ха­
Эгоцентрические предубеждения в доступности... 211
рактера, которыми обладают участники. Хотя разнообразие объяснений
этого эффекта было предложено к рассмотрению (Jones и N isbett, 1971), не­
давний акцент был поставлен на перцептивной обработке информации
(Storm s, 1973; Taylor и Fiske, 1975). Визуальные рецепторы участника на­
целены на окружающую среду; наблюдатель может сосредотачиваться не­
посредственно на нем. Таким образом, различные аспекты ситуации суще­
ственны для участников и для наблюдателей, неравенство, которое отраже­
но в их причинных приписываниях. Это предположение, каж ется, проти­
воречит положению, что участники во взаимодействии с другими людьми в
значительной степени погружены в себя.
Два исследования предлагают подтверждение существующей гипотезы.
Роджерс, К уипери Киркер (Rogers, K uiper, K irker, 1977) показали, что чер­
ты характера, выраженные прилагательными, вспоминались легче, если
испытуемых просили соотнести их с собой (т.е. описывала ли каж дая черта
их), чем когда их просили о множестве других оценок (например, оценки
синонимичности). Эти данные подразумевают, что возможность соотнесе­
ния с собой увеличивает доступность. Однако, Роджерс и др. не противопо­
ставляли вспоминание прилагательных, относящихся к себе с вспомина­
нием прилагательных, относящихся к другим - сравнение, которое было
бы более подходящ им для текущего обсуждения. Гринвальд и Альберт
(Greenwald, A lbert, 1968) обнаружили, что люди вспоминали, свои собствен­
ные вы сказы вания по определенному е опросу более точно, чем письменные
вы сказы вания других испытуемых. Так к ак высказывания самого челове­
ка и других людей отражали всегда противоположные точки зрения, Грин­
вальд и Альберт подтвердили большую осведомленность и лучшее запоми­
нание аргументов, совпадающих с собственной позицией, чем запоминание
само-произведенных утверждений, хотя свидетельство для изучения пре­
дубеж дениям сом нительно, нап ри м ер, G reenw ald и S a k u m u ra , 1967;
Malpass, 1969.
Мы провели экспериментальное исследование, чтобы определить, мож ­
но ли получить подтверждение предполагаемого предубеждения доступно­
сти. Студентов старших курсов, посещающих семинар, попросили оценить,
сколько минут каж ды й участник семинара говорил в течение прошедшего
занятия. Дополнительно были отобраны 26 испытуемых из групп по два че­
ловека, к которым подходили в кафетериях и залах. Участников в этих груп­
пах попросили оценить процент полного времени, в течение которого к а ж ­
дый человек говорил в течение текущего взаимодействия.
Предполагалось, что испытуемые будут основывать свои оценки време­
ни на частях беседы, которые они могли с легкостью вспомнить. Таким об­
разом, если имеется предубеждение в пользу вспоминания собственных ут­
верждений, оценки человеком количества времени, в течение которого он
сам говорил, должны превысить среднее время говорения, приписанное ему
другими членами группы.
212 ДОСТУПНОСТЬ
Результаты подтвердили предположения. Д ля семи из восьми студентов
на семинаре старшекурсников, оценки их собственного времени говорения
превысили среднюю оценку времени, приписанную им другими участни­
ками (р < 0.05, тест знаков). Точно так ж е оценки собственного времени раз­
говора у 10 из 13 пар превысили оценки времени, данные другими участни­
кам и (р < 0.05, тест знаков). Величина предубеждения была существенной
для 13 пар, F (1, 12) = 14.85, р <0.005; в среднем участники оценили, что
они говорили 59% времени. Эти данные обеспечивают предварительные,
хотя и косвенные, подтверждения предполагаемого предубеждения доступ­
ности в ежедневных ситуациях...

Э ксперим ент 1
В этом эксперименте, мы хотели исследовать эгоцентрические предубежде­
ния в естественно складываю щ ихся, длительных отношениях. Ж енатые
пары представляли идеальную целевую группу. Супруги участвуют во мно­
гих совместных делах различной важности. Это обстоятельство должно пре­
доставлять возможности для эгоцентрических предубеждений.
Соответственно, первый эксперимент проводился (а) чтобы определить,
происходят ли эгоцентрические предубеждения в распределениях ответ­
ственности в брачных отношениях; (Ь) чтобы воспроизвести, используя раз­
личную меру зависимости, эгоцентрическое предубеждение доступности,
полученное в предварительных испытаниях; и (с) чтобы соотнести преду­
беждение доступности с предубеждением в ответственности. Если предубеж­
дение в ответственности вызвано предубеждением доступности, два набора
данных должны быть связаны.

М ет од

И с п ы т у е м ы е : 37 супруж еских пар, ж ивущ их в студенческих общ ежитиях. Двадцать


пар имели детей. Испытуемые были привлечены двумя научными сотрудницами, ко­
торые обходили комнаты общ ежитий и кратко описывали эксперимент. Если пара хо­
тела участвовать, назначалась встреча. Исследование проводилось в квартире пары;
каж дой паре было оплачено 5 $ за участие.

П р о ц е д у р а . Анкетный опрос был создан на основе обширных предварительных интер­


вью с шестью супружескими парами. В эксперименте, анкетный опрос был выполнен
индивидуально мужем и женой; анонимность была гарантирована. На первых страни­
цах анкетного опроса испытуемых просили оценить степень своей ответственности за
каж дое из 20 действий, соответствующих супружеским парам, проводя косую линию
через 150-миллиметровую прямую линию, концы которой были помечены “прежде
всего ж ена” и “прежде всего м уж ”.1Эти двадцать действий были: приготовление завт­

1В предварительных интервью, мы использовали процентные оценки. Мы обнаружили, что


тестируемые были способны помнить проценты, которые они записали и что сравнения постан-
Эгоцентрические предубеждения в доступности,.. 213
рака, мытье посуды, уборка, покупки продовольствия, присмотр за детьми, планиро­
вание совместного отдыха, решение, на что должны быть потрачены деньги, решение,
где жить, выбор друзей, принятие важных решений, которые затрагивают Вас обоих,
инициатор споров м еж ду Вами, разрешение конфликтов, причина беспорядка в доме,
стирка, поддерживание контакта с родственниками, проявление привязанности к суп­
ругу (супруге), вынос мусора, раздражение супруга (супруги), ожидание супруга (суп­
руги), принятие решения, иметь ли детей.
Испытуемых затем просили делать кратко запись примеров своих вкладов или вкла­
дов супруга (супруги), сделанные в каждый вид деятельности. Их письменные отчеты
были впоследствии исследованы, чтобы оценить, были ли собственные входные дан­
ные человека более “доступны”. То есть, имеют ли тенденцию примеры, о которых со­
общили испытуемые, сосредотачиваться больше на их собственном поведении, чем на
поведении их супруги (супруга)? Наблюдатель, не принимающий во внимание экспе­
риментальную гипотезу, сделал запись количества различных примеров, в которых
испытуемые сообщили о своих собственных вкладах и вкладах супруга (супруги). Д ру­
гой наблюдатель закодировал одну треть данных; надежность (коэффициент корреля­
ции Пирсона) составила 0.81.

Р езульт ат ы
Ответы обоих супругов на каж ды й из вопросов об ответственности были сум­
мированы так, чтобы общее количество включило то значение, которое жена
рассматривала к ак ее вклад, и то количество, которое муж рассматривал
как его вклад. Так как ш кала ответа была 150 миллиметров длиной, было
размещено 150 “единиц ответственности”. Сумма больше, чем 150 указы ­
вала на эгоцентрическое предубеждение в каж ущ емся вкладе, — то, что, по
крайней мере, один из супругов переоценивал свою ответственность за эту
деятельность. Чтобы оценить степень пере- или недооценки, которую этот
супруг показал для каждого вида деятельности, 150 вычиталось от общей
суммы каждой пары. Общий счет был получен для пары в среднем по 20
действиям (или 19, когда у пары не было детей).
Дисперсионный анализ, использующий пару как единицу анализа, по­
казал, что общий счет был значительно больше нуля, М = 4.67, F (1, 35) =
12.89, р < 0.001, указы вая эгоцентрическое предубеждение в воспринятых
вкладах. Двадцать семь из 37 пар показали некоторую степень переоценки
(р < 0.025, тест знаков). Более того, в среднем, переоценка произошла в 16
из этих 20 пунктов в анкетном опросе, вклю чая отрицательные пункты -
например, причина споров между вами, F (1, 32) = 20.38, р < 0.001. Хотя
величина переоценки была относительно маленькой, в среднем, испытуе­
мые имели тенденцию использовать ограниченный диапазон ш калы . Боль­
шинство ответов были слегка выше или слегка ниж е середины ш калы . Ни
один пункт не показал существенный эффект недооценки.

кетных процентов явились источником конфликтов между супругами. Использование 150-


миллиметровой шкалы обошло эти трудности; тестируемые не были склонны, преобразовы­
вать свои косые линии в точные проценты, которые могли обсуждаться в дальнейшем.
214 ДОСТУПНОСТЬ
Второй набор пунктов в анкетном опросе требовал от испытуемых запи­
сать примеры их собственных вкладов и вкладов их супруга (супруги) в к аж ­
дый вид деятельности. Средний счет различия был получен по этим 20 ви­
дам деятельности (в среднем муж и жена), с количеством примеров вкладов
супругов вычтенных из количества примеров собственных вкладов. Тест
генеральной средней был существенен, F(l, 35) = 36.0, р < 0.001; к а к и ож и­
далось, испытуемые привели большее количество примеров своих собствен­
ны х вкладов (М = 10.9), чем вкладов супруга(супруги) (М =8.1). Отношение
между разницей счета сам-другой и изначальной мерой воспринятой ответ­
ственности была определена. Как было предположено, чем больше тенден­
ц и я вспоминать свое релевантное поведение, тем больше была переоценка
воспринятой ответственности, г (35) = 0.50, р < 0.01.
Количество слов, содержащ ихся в каждом поведенческом примере, о
котором сообщили испытуемые, было такж е оценено, чтобы обеспечить сте­
пень проработки или полноту вспоминания. Среднее количество слов в при­
мере не выделяется как функция того, порождалось ли данное поведение
самим собой (М = 10.0) или супругом(супругой) (М = 10.1), F < 1. Далее, эта
мера была некоррелирована с мерой воспринятой ответственности, г(35)=-0.15,
не значимо.
И так, как мера ответственности, так и мера, отраж аю щ ая доступность
соответствующего поведения, показала предполагаемые эгоцентрические
предубеждения. Кроме того, имеется существенная корреляция между ве­
личиной предубеждения в доступности и величиной предубеждения в от­
ветственности. Этот вывод согласуется с гипотезой, согласно которой эго­
центрические предубеждения в приписываниях ответственности опосредо­
ваны предубеждениями доступности. Наконец, количество воспроизведен­
ных актов поведения было важным фактором, более чем богатство вспомина­
н и я....

Э ксперим ент 2
В эксперименте 2 мы попросили игроков из 12 университетских сборных
баскетбольных команд индивидуально заполнить анкетный опрос, в кото­
ром было необходимо вспомнить важ ны й поворотный момент в их после­
дней игре и оценить, почему их команда выиграла или проиграла.
Это возможность уйти от сравнений сам-другой, которые мы рассмотре­
ли в предыдущих исследованиях, к сравнению команда - другая команда.
Существует, однако, множество причин ожидать, что действия собственной
команды должны быть более доступны наблюдателям, чем действия дру­
гой команды: я знаю имена моих товарищей по команде, и поэтому, у меня
есть готовые средства для организации хранения и выборки данных, соот­
ветствующих им; наш успех в будущих играх с другими противниками за­
висит больше от наш их собственных наступательных и защитных способ­
ностей, чем от способностей противостоящей команды. Следовательно, я
Эгоцентрические предубеждения в доступности... 215
могу внимательнее следить за действиями моих товарищей по команде, что
облегчает кодирование и хранение. Также, имеются информационные раз­
личия: стратегии собственной команды более существенны, чем стратегии
противостоящей команды (Tversky и Kahneman, 1973,11). Если инициати­
вы собственной команды дифференциально доступны, игроки должны
вспомнить поворотный момент в терминах действий своей команды и при­
писать ответственность за исход игры своей команде....

М ет од

И с п ы т у е м ы е . В исследовании учавствовали игроки университетских сборных команд


по баскетболу: 74 женского пола и 84 мужского пола. С менеджерами команды связа­
лись по телефону; после обсуждений с игроками, они разрешили командам участво­
вать в исследовании.

П р о ц е д у р а . Анкетные опросы проводились после шести игр, в которых команды, уча­


ствующие в исследовании, играли друг с другом. Таким образом, для трех выбранных
игр с мужскими командами, три из шести м уж ских команд в исследовании играли про­
тив других трех м ужских команд. Точно так ж е три выбранные игры м еж ду женщина­
ми, включали все шесть ж енских команд. Анкетные опросы проводились при первой
практике команды, последовавшей за целевой игрой (1 или 2 дня после игры), кроме
одного случая, где из-за расписания игр команд, было необходимо собрать данные не­
медленно после игры (две женские команды,. Анкетные опросы были проведены инди­
видуально, и анонимность испытуемых была гарантирована. Следующие вопросы были
заданы:

1. Пожалуйста, кратко опишите один важный поворотный момент в прошлой игре и


обозначьте, в каком периоде игры он произошел.

2. Наша команда выиграла / проиграла прошлую игру потому что...

Ответы на первый вопрос были исследованы, чтобы определить, был ли поворотный


момент описан как созданный действиями собственной команды, обеих команд, или
другой команды. Ответы на второй вопрос были исследованы, чтобы оценить количе­
ство причин победы или поражения, которые имели отношение либо к собственным
действиям, либо к действиям другой команды. Данные были закодированы человеком,
не знавшим экспериментальной гипотезы. Второй наблюдатель независимо закодиро­
вал ответы 50% испытуемых. Имелось соответствие 100 % для обоих вопросов.

Результ ат ы
Не было обнаружено никаких существенных половых различий в двух за­
висимых измерениях, поэтому о результатах сообщается независимо от пола.
Так к ак ответы членов команды не могут рассматриваться к ак независи­
мые, было подсчитано среднее значение ответов, и команда, служила как
единица анализа.
216 ДОСТУПНОСТЬ
Предварительная проверка данных “поворотного момента” показала, что
даж е в пределах команды игроки вспоминали весьма различные события.
Однако 119 игроков вспомнили поворотный момент, который они описали
к а к созданный действиями их собственной команды; 13 игроков вспомни­
ли поворотный момент, который они рассмотрели, к а к вызванный обеими
командами; 16 игроков вспомнили, поворотный момент, который, к ак им
казалось, инициирован действиями противоположной команды (оставши­
еся 10 игроков не ответили на вопрос). Испытуемые описали такие события
к а к сильную защ иту в течение последних 2 минут игры, изменение в насту­
пательны х стратегиях, и так далее.
Процент игроков, которые вспомнили поворотный момент, к ак вызван­
ный членами их команды, был получен для каждой команды. Эти 12 мно­
жеств были подвергнуты анализу, в котором они сравнивались со случай­
ным ожиданием 50% . Полученное распределение сильно отличалось от слу­
чайного, F (1,11) =30.25, р < 0.001, со средним 80.25% . К ак и было предпо­
ложено, большинство сообщений выделяли действия собственной коман­
ды.
Процент игроков, которые вспомнили поворотный момент, к а к вызван­
ный членами их команды, был исследован относительно игры команды.
Средний процент был выше у проигравшей команды, чем у победившей в
пяти из шести игр (р < 0.11, тест знаков). Средняя разница между процен­
тами проигравших (М = 88.5) и выигравш их (М =72) команд была незначи­
мой (F <1).
Бы ли такж е исследованы объяснения игроков относительно победы или
проигрыш а их команды. Из 158 участников, только 14 указали причины,
которые вклю чали действия противостоящей команды. В среднем, испы­
туемые сообщили о 1.79 причинах, касающиеся собственной команды и 0.09
п р и ч и н , к а саю щ и х ся п роти воп олож н ой ко м ан д ы , F (1, 11) = 2 7 2 .9 1 ,
р < 0.001. Наконец, тенденция приписывать больше причин для собствен­
ной команды была незначительно большая после проигрыша (М= 1.73), чем
после победы (М= 1.65), F < 1.

Обсуждение
Ответы н а вопрос о поворотном моменте указывают, что действия товари­
щ ей по команде испытуемых были более доступны, чем действия членов
противостоящей команды. Далее, испытуемые приписывали ответствен­
ность за исход игры действиям или бездействию скорее своих товарищей по
команде, чем членов противоположной команды. Таким образом, предубеж­
дения в доступности и оценки ответственности могут происходить на уров­
не групп. Ратер и Хесковиц (R ather, Heskowitz ,1977) приводят другой при­
мер группового эгоцентризма: “CBS (новости) стали лидером после запуска
на Луну Апполона в 1968. Если Вы - сотрудник CBS, Вы склонны считать,
что ваше описание приземления на Луну перевернуло наше воприятие. Если
Эгоцентрические предубеждения в доступности... 217
Вы - сотрудник NBC, Вы склонны рассматривать раскол команды Хантли-
Бринк ли(НшШеу- Brinkley) к ак ключевой фактор “ (с. 307)....

Э ксперим ент 3

В эксперименте 3, мы попытались изменить центр внимания человека, что­


бы затронуть доступность. Мы использовали манипуляцию, предназначен­
ную для активизации выборочного исправления информации, непосред­
ственно соответствующей приписываниям ответственности.
В нашем первоначальном анализе, мы предположили, что причиной эго­
центрических приписываний ответственности могло быть выборочное вос­
произведение информации из памяти и что на воспроизведение можно по­
влиять с помощью вопросов, которые люди задают самим себе. Эксперимент
3 проводился для проверки этой гипотезы. У испытуемых вызывались раз­
ные виды воспроизведения с помощью изменения формулировок вопросов.
Выпускников попросили подумать либо об их собственных вкладах в их дип­
ломы на звание бакалавра гуманитарных наук, либо о вкладах их научных
руководителей. Оценивать степень ответственности за научную работу, ко­
торую испытуемые приписали либо себе, либо научным руководителям,
было оценено. Предположили, что испытуемые примут меньше ответствен­
ности за исследуемую проблему при условии направленности на научного
руководителя, чем при условии направленности на себя.

М етод

И с п ы т у е м ы е . 17 выпускников факультета психологии женского полай 12 мужского.


Большинство закончили 1 или 2 года аспирантуры. Все студенты провели эксперимен­
ты, ставшие основанием для диплома на звание бакалавра гуманитарных наук на пос­
леднем году обучения.

П р о ц е д у р а . С испытуемыми общались индивидуально в их офисах и просили заполнить


краткий анкетный опрос наотношение студент-научный руководитель. Ни один не отка­
зался участвовать. Две формы анкетного опроса были наугад распределены среди испы­
туемых; анонимность и конфиденциальность были гарантированы.

В одной из форм анкетного опроса испытуемых просили указать свой собственный вклад
в каждое и з множества действий, связанных с их бакалаврскими дипломами. Вопросы
были следующие: (а) “Я п р едл ож и л __ процентов методологии, которая в конечном
итоге использовалась в исследовании.” (В) “Я обеспечил _ процентов интерпретации
результатов.” (С) “Я был инициатором__ процентов обсуждений, касающихся дипло­
ма, с моим руководителем.” (D) “В течение связанных с дипломом обсуждений я был
склонен управлять курсом и содержанием обсуждения__ процентов времени.” (Е) “Учи­
тывал все, я был ответствен з а ___ процентов всех усилий, приложенных к исследова­
нию.” (F) “Как бы Вы оценили Ваш диплом относительно других дипломов, сделанных
на факультете? “
Вторая форма анкетного опроса была идентична вышеупомянутой, за исключением
218 ДОСТУПНОСТЬ
того, что слово Я (условие направленности на себя) было заменено на м ой р у к о в о д и т е л ь
(условие направленности на руководителя) в вопросах 1-5. Испытуемых попросили за­
полнить бланки с ответами на первые пять вопросов и провести косую черту через 150-
миллиметровую линию, с концами, помеченными “х уж е” и “лучше”, в ответ на вопрос
6.

Р езульт ат ы и обсуждения
С целью анализа, было принято, что вклад руководителя и студента в к аж ­
дый пункт составляет в целом 100% . Хотя эксперимент был представлен
к а к изучение отношения студент-руководитель, возможно, что студенты
рассматривали в своих оценках входные данные других людей (например,
других студентов). Однако данная процедура обеспечивает умеренное ис­
пытание экспериментальной гипотезы. Например, если тестируемый отве­
чал 20 % на пункт в “Я ”-версии анкетного опроса, считалось, что его или ее
руководитель внес вклад 80% . Руководитель, возможно, внес только 60%,
а неизвестный человек остальные 20% . Возможно переоценивая вклад ру­
ководителя, однако, мы смещаем данные против экспериментальной гипо­
тезы: “Я”- версия, к а к ожидалось, уменьшит процент ответственности, при­
писываемой руководителю.
Ответы испытуемых на первые пять вопросов в “Я”-версии анкетного оп­
роса вычитались из 100 так, чтобы более высокие числа отражали большие
вклады руководителя в обоих условиях. Вопрос 5 имел дело с полной ответ­
ственностью за исследование. Как и ожидалось, испытуемые приписали боль­
ше ответственности руководителю при условии направленности на руково­
дителя (М = 33.3 %), чем при условии направленности на себя (М = 16.5 %),
F (l, 27) = 9.05, р < 0.01. Первые четыре вопроса касались различных аспек­
тов диплома, и средний ответ показал похожие результаты: направленность
на руководителя М = 33.34; направленность на себя М = 21.82; F (1,27) =5.34,
р < 0.05. Наконец, испытуемые имели тенденцию оценивать свой диплом бо­
лее положительно при условии направленности на себя, чем при условии на­
правленности на руководителя: 112.6 против 94.6, F (1, 27) = 3.59, р < 0.10.
Контрастирующая формулировка вопросов имела ожидаемое воздействие
на распределения ответственности. Версия анкетного опроса, касающ аяся
руководителя, возможно, заставила испытуемых вспомнить, большую часть
вкладов их руководителей, чем “Я”-версия анкетного опроса. Эта диффе­
ренциальная доступность была отражена в распределениях ответственнос­
ти. Обратите внимание, что вопросы не поддавались контролю испытуемых
за счет исправлений. Научному руководителю приписывалась только тре­
тья часть ответственности за диплом в условии направленности н а руково­
дителя.
В свете существующих данных, приписывания баскетболистов ответ­
ственности за исход игры в эксперименте 2 должны были быть заново ис­
следованы. Вспомните, что игроков просили закончить предложение, “Наша
Эгоцентрические предубеждения в доступности... 219
команда выиграла / проиграла последнюю игру потому что... ” Этот вопрос
выдал высоко значимое эгоцентрическое предубеждение. Оценивая прошлое
испытание, очевидно, что форма вопроса - “Наша ком анда... нашу прошлую
игру” — , возможно, побудила испытуемых сосредоточиться на действиях
их собственных команд, даже при том, что формулировка не устраняет ссыл­
ки на противоположную команду. Вопрос про “поворотный момент” в экс­
перименте 2 был более нейтрально сформулирован и не может интерпрети­
роваться двояко.
Главные вопросы в этих исследованиях исходят из внешнего источника;
многие из наших вопросов исправления само-инициированы, однако, и наше
вспоминание может вполне быть смещено формой, в которой мы самим себе
излагаем вопросы исправления. Например, баскетболисты, скорее всего,
будут думать в терминах “Почему мы выигрывали или проигрывали? “ Чем
в терминах, сформулированных нейтрально “К акая команда была ответ­
ственной за исход игры?”...
Настоящее исследование демонстрирует распространенность центриро­
ванных на себе (self-centered) предубеждений доступности и оценок ответ­
ственности. В повседневной ж изни, эти эгоцентрические тенденции могут
не замечаться, когда объединенные усилия не требуют явных распределе­
ний ответственности. Если распределения обозначены отчетливо, однако,
появляется повод для разногласия, и люди, вряд ли, поймут, что различия
в оценках могут исходить из оценок информации, которая является диффе­
ренциально доступной.
13. Предубеждения доступности в социальном
восприятии и взаимодействии*

Ш е л л и И . Т ей лор

К аж ды й день человек делает многочисленные, сложные социальные оцен­


ки - прогнозирование поведения других людей, приписывание ответствен­
ности, отнесение человека к категории, оценка других людей, оценка влас­
ти, влияния человека или причинную атрибуцию. Главная задача социаль­
ной психологии состоит в том, чтобы определить, к ак субъект делает эти
оценки. До недавнего времени, исследование этой темы было отмечено ра­
ционалистичным предубеждением, предположением о том, что оценки де­
л аю тся, и сп ол ьзуя полны е, оп ти м альны е стратеги и (см ., например,
Fischhoff, 1976, для обсуждения этой темы). Ошибки в оценках были при­
писаны двум источникам: (а) случайные ошибки из-за проблем с информа­
цией, о которой человек не знал; и (Ъ) ошибки, которые являлись следстви­
ем иррациональных мотивов и потребностей человека.
В пределах социальной психологии эта перспектива представлена иссле­
дованием причинной атрибуции. В ранних формулировках атрибуции (на­
пример, Jones & Davis, 1965; Kelley, 1967) человек был охарактеризован как
неопытный ученый, который собирал информацию из множества источни­
ков окружающей среды, чтобы делать приписывания относительно причин­
но-следственных отношений. Когда наблюдались отклонения от норматив­
ных моделей, считалось, что они происходят от предубеждений, таких как
гедоническая релевантность (Jones & Davis), 1965) или других эгоцентри­
ческих потребностей (см. M iller & Ross, 1975).
Однако в течение многих лет, все большее количество данных доказыва­
ло не только то, что оценки и реш ения людей менее закончены и рациональ­
ны, чем считалось, но что не все ошибки могут исходить из мотивационных
факторов. Д аж е при отсутствии мотивов, оценки часто делались на основа­
нии скудных данных, которые, по-видимому, были случайно объединены и

* Подготовка части книги была поддержана Исследовательским Грантом Национального


Научного Фонда № BNS 77-09922
Предубеждение доступности в социальном ... 221
находились под влиянием предвзятых мнений (см., например, Dawes, 1976).
Эти выводы привели к пересмотру когнитивной системы. Люди стали рас­
сматриваться к ак обладающие ограниченными возможностями, способны­
ми к оперированию только небольшим количеством данных одновременно.
В отличие от “наивного” ученого, который оптимизирует, человек, к а к счи­
тается, “сатисфицирует” (Simon, 1957) и использует сокращ ения, которые
приведут к решению и оценке эффективно и точно.
Один из наиболее провокационных и влиятельных вкладов в пересмотр
процесса оценивания - это работа Канемана и Тверского о когнитивной эв­
ристике (Kahneman и Tversky, 1973, 4; Tversky и Kahneman, 1974, 1). Со­
гласно Тверскому и Канеману (1974,1), эвристика используется в условиях
неопределенности, или недоступности, или неоднозначности важной инфор­
мации. В не-социальных оценках неопределенность вытекает, прежде все­
го, из ф акта, что информация, соответствующая отдельно взятой оценке,
является почти всегда неполной. Соответствующий фактический материал
может быть недоступен, он не может быть собран вовремя, чтобы влиять на
решение, или может быть слишком объемным, чтобы быть должным обра­
зом организованным и использоваться в задаче оценки.
Эвристика - это вероятные стратегии для создания социальных, а такж е
несоциальных оценок по нескольким причинам. Во-первых, различие меж ­
ду социальными и несоциальными оценками условно, фактически любая
сущ ественная оценка имеет социальные последствия. Во-вторых, соци­
альные оценки включают те ж е виды неопределенности, которые характе­
ризуют несоциальные оценки. В-третьих, социальные оценки включают
новые источники неопределенности. Информация относительно людей бо­
лее неоднозначна, менее надежна и более непостоянна, чем информация от­
носительно предметов или несоциальных событий, так как личные призна­
ки не написаны на лицах людей, к а к у предметов обозначен их цвет, форма
или размер. Таким образом, личные признаки скорее должны быть выведе­
ны, чем наблюдаемы непосредственно. У людей есть намерения, не все из
которых непосредственно обозначены. Учитывая, что наиболее существен­
ные социальные действия могут совершаться по различным причинам и
приведут к различным последствиям, значение социального действия по
существу неоднозначно. Хотя предметы сохраняют свои признаки незави­
симо от ситуации и времени, мотивы людей меняются от ситуации к ситуа­
ции, и цели меняются к ак с минуты на минуту, так и в течение жизни; та­
ким образом, даже правильный вывод в одной ситуации может быть беспо­
лезен с точки зрения прогнозов. Отсутствие полной, надежной, прогнози­
рующей информации относительно людей и социальных взаимодействий
предполагает, что люди используют эвристики, позволяющие им делать
выводы и предсказания, отталкиваясь от тех скудных и ненадежных дан­
ных, которые являю тся доступными.
222 ДОСТУПНОСТЬ
Эврист ика доступности
Одна из таких эвристик - доступность. “Считается, что человек, использует
эвристику доступности всякий раз, когда он оценивает частоту или вероят­
ность посредством легкости, с которой случаи или ассоциации приходят на
ум” (Tversky и Kahneman, 1973, с. 208,11). Человек предполагает, что, если
примеры приходят на ум быстро, то их должно быть много, или если ассо­
циация проделывается легко, тогда она должна быть точной, так как ассо­
циативные связи приходят с опытом. Кроме того, именно легкость воспо­
минания, построения и ассоциации, обеспечивает оценку частоты или ве­
роятности, а не общая сумма примеров или ассоциаций, которые приходят
на ум. Таким образом, важ ная разница между использованием эвристики
доступности и использованием более сложного процесса - то, что произво­
дится мало поправок; оценка легкости, с которой этот процесс может быть
выполнен, является достаточной к ак основание для вывода.
Тверски и Канеман (1973,11) предлагают два общих класса задач, в кото­
ры х предубеждение доступности могло бы заметно фигурировать: построе­
ние случаев и ассоциаций и выборка ассоциаций и случаев. Эти две общие
задачи - такж е задачи субъекта. При некоторых обстоятельствах нас могут
попросить воспроизвести социальное поведение, к ак в попытке угадать, как
друг поведет себя, узнав, что жена от него уходит. В таких случаях каждый
конструирует социальную действительность, с которой данный случай мо­
ж ет быть сравнен. В других случаях, человек может основываться на про­
ш лы х примерах поведения, чтобы сделать выводы, например, он может
вспомнить случаи, к ак друг справлялся с кризисными ситуациями в про­
шлом, чтобы спрогнозировать, как он справится теперь.
В некоторой степени предположения относительно отношения между
легкостью воспроизведения и количеством примеров или ассоциаций, точ­
ны, и настолько, насколько они точны, человек, использующий эвристику
доступности, придет к правильным выводам или, по крайней мере, к тем,
которые будут соответствовать выводам, достигнутым, при использовании
более сложных процедур. При других обстоятельствах, однако, эти выводы
могут быть неточными, потому что существуют предубеждения в доступ­
ных данных, которые имеют отношение к задаче. Существует, по крайней
мере, три способа, с помощью которых предубеждения в доступных данных
могут смещать следующие друг за другом социальные процессы. Во-пер­
вых, только существенные данные могут быть более доступны и, следова­
тельно, оказывать непропорциональное влияние на процесс суждения. Во-
вторых, предубеждения в самом процессе происпроизведения могут выда­
вать нерепрезентативную основу данных. В-третьих, стойкие когнитивные
структуры человека, такие к ак убеждения и ценности, способствуют появ­
лению предубеждений, усиливающих доступность определенных свиде­
тельств, таким образом, смещая процесс оценки. Присутствие любого из
таких предубеждений может привести к необъективным выводам.
Предубеждение доступности в социальном ... 223
Предубеж дения доступности и заметности: пример
Предубеждения заметности проявляются в том, что красочные, динамичес­
кие или другие отличающиеся стимулы непропорционально привлекают
внимание, и соответственно влияют на оценки. Один из примеров такого
предубеждения был назван фундаментальной ошибкой атрибуции (см.
Ross, 1977), и он относится к распространяющемуся предубеждению видеть
людей к а к причинных агентов в окружающей среде. То есть в социальном
окруж ении, где либо человек, либо некоторая ситуативная переменная яв­
ляется вероятным причинным фактором для исхода, существует общее пре­
дубеждение, чтобы видеть людей к а к причинных агентов, особенно их ус­
тойчивые поведенческие признаки.
Некоторые люди более заметны, чем другие, и эта дифференциальная за­
метность в пределах социального окружения может такж е смещать процесс
оценивания. Исследования, в которых применили гештальт-принципы фи­
гурального акцента к социальному миру (см., например, M cA rthur и Post,
1977; Taylor и Fiske, 1975; Fiske и другие, 1979), показывают, что человек,
который ярко освещен, перемещается (как в кресле-качалке), контрастен (с
помощью таких тривиальных манипуляций, как цвет рубашки), или нови­
чок привлекает к себе непропорциональное количество внимания.
Социальные последствия предубеждения заметности проиллюстрирова­
ны исследованиями, изучающими воздействие статуса соло или символи­
ческой интеграции на впечатления людей о других людях. Когда компания
собирается включить членов группы меньшинств, таких, к ак чернокожих,
ж енщ ин или инвалидов, часто полной интеграции предшествует промежу­
точный шаг. На этом этапе, один или два члена этой группы, могут быть
приняты в то, что иначе было бы группой белых рабочих мужского пола, та­
ким образом, создав примеры статуса соло. Статус соло может возникать по
нескольким причинам. Отсутствие квалифицированных претендентов от от­
дельно взятой группы меньшинств; организация желает избежать угрозы
большого притока членов группы меньшинства; или статус соло может ис­
пользоваться, чтобы отразить силы конструктивного действия. Независимо
от причин для символической интеграции, к символу или человеку-соло час­
то относятся как к представителю его социальной группы. Соответственно,
оценки его поведения часто используются, чтобы предсказать, как другие
члены этой группы вели бы себя, если бы они такж е были приняты в органи­
зацию. Значение статуса соло - это его новизна. Ж енщ ина выделяется среди
мужчин, такж е к ак чернокожий выделяется среди белых людей. Такая от­
четливость способствует предубеждению заметности.
В экспериментальном аналоге этой ситуации, испытуемые просмотрели
видеофильм о маленькой группе (шесть человек), беседующих в неформаль­
ной обстановке. Некоторым испытуемым показали группу, в которой был один
афро-американец, один мужчина или одна женщ ина в среди белокожих, в
женской, или мужской компании, соответственно (Taylor и другие, 1976;
224 ДОСТУПНОСТЬ
Taylor, Fiske, Etcoff и Ruderman, 1978). Другие испытуемые наблюдали груп­
пы сравнений, где содержание обсуждения в группе было так же, как и в ус­
ловии соло, но пол, или расовый состав группы был уравнен (например, три
мужчины, три женщины). Испытуемые наблюдали обсуждение в группе и
затем делали запись своих впечатлений о людях в группах.
Согласно положению о том, что существует предубеждение значимости,
созданное статусом соло или символическим статусом, поведение черноко-
жего-соло вспоминалось несколько лучше, чем поведение этого же челове­
к а в сопоставимой смешанной группе, и было такж е оценено, что человек-
соло говорил больше по сравнению с соответствующим человеком в смешан­
ной группе.1 Это предубеждение значимости, в свою очередь, приводит к
крайности оценок. Когда человек был соло в группе, его поведение было
оценено более экстремально в любом положительном или отрицательном
направлении, по сравнению с тем ж е самым поведением в смешанной груп­
пе. Н еприятный человек был воспринят как еще более неприятный в ситу­
ации соло; хороший человек был воспринят к ак более хороший в ситуации
соло.
Используя эвристику доступности к ак объяснительную структуру, мож­
но вывести, что, когда испытуемых просили оценить человека в группе, они
пытались приблизиться к примерам соответствующего поведения или ассо­
циациям с людьми стимула, и легкость, с который такие случаи или ассо­
циации приходили в голову, приводили их к крайним суждениям. В случае
с соло, доступно больше примеров соответствующего поведения, потому что
имеется большая база данных, ведущая к крайности оценок. Эти результа­
ты предполагают, что выделяю щийся человек, будь то соло, неполноцен­
ный человек, или просто человек, отличающийся от людей, с которыми он
взаимодействует, вызовет крайние оценки у окружающих. Значение этих
результатов для социального мира, конечно, огромно. Например, если люди-
соло используются как основание для включения в группу представителей
меньшинств, и восприятие соло необъективно, то могут быть приняты не­
правильные решения. Преувеличенно отрицательные оценки человека-соло
могут привести к необоснованному завершению десегрегации. Преувели­
ченно положительные оценки могут стать основанием для ложных ожида­
ний относительно поведения других членов группы меньшинства, ожида­
н ия, которые могут не оправдаться.
М отивация не может служить объяснением предубеждения в восприя­
тии значимых людей. Хотя некоторые мотивационные процессы могут оп­
ределять отношение к инвалидам или людям-соло, трудно найти их в оцен­
ке человека, который отличается цветом рубашки или движениями. Соот­
ветственно, нужно обратиться к когнитивным факторам, а эвристика дос­
тупности обеспечивает возможное объяснение этих эффектов.

1Не было собрано данных о вспоминании в исследованиях по мужчинам- и женщинам-соло.


Предубеждение доступности в социальном ... 225
Дост упност ь и предубеждения воспроизведения: Д ва примера
Другой источник предубеждений доступности происходит от того, как ин­
ф ормация хранится или восстанавливается. То есть пам ять имеет специфи­
ческую организацию , которая мож ет облегчить процесс выбора или воспро­
изведения некоторых примеров или выводов и помеш ать появлению дру­
гих. Одним из способов вмеш ательства является простое ограничение ко­
личества информации, которая мож ет храниться в пам яти, что мож ет при­
вести к беспорядку в ассоциативных связях или примерах, которые хра­
нятся в пам яти.
Ротбарт и его коллеги (R othbart и другие, 1978) продемонстрировали эту
проблему в исследовании признаков социальных групп. Испытуемым пред­
лож или информацию о характерных чертах членов гипотетической группы
(например, Ф ил - ленивый) при одном из двух условий. Испытуемые либо
видели имена некоторых членов группы (Эд, Ф ил, Фред, Джо) со специфи­
ческой чертой (ленивый), либо они видели, что ту ж е самую пару: характер-
имя (Ф ил ленивый) одинаковое число раз. Позже испытуемых попросили
охарактеризовать группу в целом. Если испытуемые способны точно вспом­
нить, какие имена были соединены с каким и чертами характера, то выводы
относительно группы в целом должны быть более сильными, если несколько
членов группы имеют некоторую черту, чем если только один член группы
имеет эту черту. Если общее количество пар черт характер-имя, которые были
предоставлены испы туемы м, было низко, испытуемые показали это пре­
достережение в своих выводах относительно группы. Однако когда общее ко­
личество пар черт характер-имя было высоко, испытуемым было трудно удер­
ж ать в голове, сколько человек имели определенную черту характера, и они
начинали вести себя, к ак будто многократные упоминания одних и тех ж е
пар черт характер-имя были столь ж е информативны, к ак несколько различ­
ных имен, соединенные с этой чертой характера. Группа характеризовалась
как ленивая даж е, когда только несколько членов фактически были ленивы.
Социальный мир активен и часто очень информативен, и будучи таковым,
он обычно отражает состояние большой загруженности памяти (R othbart и
др., 1978) больше, чем состояние малой загруженности памяти. Эти состоя­
ния облегчили бы получение информации о стереотипах группы, отталкива­
ясь от поведения только нескольких человек, чье поведение можно наблю­
дать большое количество раз. К ак отмечают Ротбарт и другие, мы получаем
больше информации от отрицательных, чем положительных событий, и со­
ответственно все эти предубеждения могут поддерживать формирование от­
рицательных стереотипов группы, особенно, если членство группы существен­
но при упоминании в средствах информации.
Второй пример воздействия предубеждений выборки на социальные оцен­
ки - это эгоцентрическая атрибуция (Ross & Sicoly, 1979, 12). Во многих
контекстах человек должен делать оценки относительно того, кто является
ответственным за результат. Авторство книги должно быть определено, пла­
226 ДОСТУПНОСТЬ
та за консультацию долж на быть разделена среди сотрудников, или ответ­
ственность на победу группы, или поражение должна быть разделена. Кро­
ме того, что каж ды й человек хранит список своих собственных вкладов и
вкладов другого человека (стратегия некоторую отчаявш иеся пострадавшие
были вынуждены принять), все стороны должны прийти к компромиссу
относительно того кто что делал в совместном предприятии. Эвристика дос­
тупности обеспечивает потенциальную стратегию для этого. Можно пере­
бирать примеры собственных вкладов и вкладов других людей и на основе
того, сколько примеров приходит на ум, реш ать, кто сделал больше. Одна­
ко могут присутствовать предубеждения, мешающ ие точно оценивать. Од­
ним из предполагаемых предубеждений является эгоцентрическое вспоми­
нание, способность вспоминать собственные вклады несколько лучш е, чем
вклады другого человека. Это предубеждение вспоминания мож ет, в свою
очередь, производить предубеждения каж ущ ейся ответственности. Н апри­
мер, если я могу вспомнить ш есть случаев, когда я выносила мусор, и толь­
ко три раза, к ак это делал мой м уж , я могу сделать вывод, что на мне лежит
ответственность за вынос мусора. В недавнем исследовании, распределение
обязанностей в семье, оказалось особенно полезным, такж е к ак и накален­
ны й контекст, в котором необходимо исследовать предубеждение доступно­
сти (Ross & Socoly, 1979,12). Тридцать семь супружеских пар были опроше­
ны относительно их вкладов в различные действия, которые женатые люди
должны исполнять, такие как приготовление завтрака или мытье посуды.
Каждого члена пары просили указать, был ли каж ды й вид деятельности вы­
полнен прежде всего мужем или прежде всего женой. Каждый человек так­
ж е указы вал определенные примеры того, что он или супруга влож или в дея­
тельность, измерение, предназначенное, чтобы выявить относительную дос­
тупность собственных вкладов против вкладов супруга(супруги).
Результаты ясно показали, что каж ды й супруг (супруга) думал что он
влож ил больше в совместные действия, чем другой супруг (супруга). Когда
счет ответственности двух партнеров был сложен, он превысил уровень пол­
ной ответственность, которую можно было принять. Количество определен­
ных примеров вкладов, которые каж ды й супруг (супруга) сделал, было так­
ж е подсчитано, и результаты показали, что количество вкладов приписан­
ны х себе, намного превыш ает количество вкладов, приписанных супругу
(супруге). К орреляция между запомненными примерами и приписывани­
ем ответственности была высока (+ 0.51), предполагая, что предубеждение
вспоминания могло уменьш ить предубеждение ответственности.
Одно из возможных объяснений этих эффектов основывается на мотива­
ционных принципах и предполагает, что люди приписывают себе больше, чем
им полагается, чтобы сохранить или увеличить положительную самооцен­
ку. Если это правильно, то мы должны обнаружить, что при неудаче совмес­
тного проекта, люди будут отрицать свой вклад в нее и приписывать ответ­
ственность другим. Например, если супружеская пара делает покупку, кото­
рая, оказы вается ненужной, каж ды й может винить другого за решение. Росс
Предубеждение доступности в социальном ... 227
и Сиколи (1979,12) исследовали эту возможность и обнаружили, что это толь­
ко слабо способствовало эгоцентрическим приписываниям. Люди так ж е ве­
роятно принимали непропорциональную ответственность за неудачный со­
вместный проект, как и за хороший.
Когнитивное объяснение этих эффектов основано на том, к ак воспроиз­
ведение или хранение информации порождают предубеждения каж ущ ей­
ся ответственности. Предубеждение близости может присутствовать, то есть
каж ды й наблюдает собственный вклад более близко, чем вклады других, и,
реш ая, кто за что отвечает, большее количество собственных вкладов при­
ходит на ум. Например, если оба супруга работают в одно и то ж е время,
каж ды й может отвлечься от вкладов другого и более тщ ательно наблюдать
свои собственные вклады . С другой стороны, можно знать меньше о вкла­
дах других людей, потому что каж ды й ф изически не присутствует, когда
один из супругов делает свою долю работы; соответственно, можно недооце­
нить количество времени и усилия, которые прилож ил супруг или супруга.
К тому ж е, предубеждение может присутствовать, если один человек думал
о своих вкладах больше, чем о вкладах другого. Это особенно вероятно, ког­
да совместный проект вклю чает много размы ш лений, письма и других ви­
дов длительной по времени работы, таких, как планирование капитального
ремонта в доме или организация вечеринки. Третья возможность состоит в
том, что собственные вклады подходят личным конструкциям или схемам,
то есть способам обработки и кодирования информации. И нформация, ко­
торая удовлетворяет существующей ранее схеме, вспоминается более лег­
ко, и таким образом, увеличенная доступность собственных вкладов может
отраж ать предубеждение воспроизведения (см. Taylor & C rocker, 1979b). В
итоге, предубеждения относительно того, к ак информация хранится или
восстанавливается, могут привести к необъективным социальным оценкам.
Один из возможных посредников - использование эвристики доступности.

Дост упность и предубеждения, возникающ ие благодаря когнит ив­


ным ст рукт урам
Третий способ, за счет которого доступность мож ет смещ ать социальные
оценки - использование субъектом испробованных правил, схем или дру­
гих когнитивны х структур. Люди обладают определенными структурами
для обработки поступающей информации, которые они часто используют и
которые, постепенно, превращ аю тся в познавательные привы чки. Мы пред­
полагаем, например, что люди будут использовать некоторые черты харак­
тера людей к ак способы организации информации о лю дях по другим чер­
там. Н апример, ученые часто различаю т людей по уровню интеллекта, при­
ним ая во внимание, что для спортсменов, скорее спортивный навы к, чем
интеллект является отличительным фактором. Этот вид предубеждения в
тенденции использовать специфические схемы или конструкции, может
такж е искаж ать оценки. Н апример, если кого-нибудь просят описать впе­
228 ДОСТУПНОСТЬ
чатления об отдельно взятом человеке, можно использовать предпочитае­
мые черты (например, интеллект) к ак способ поиска в пам яти и описывать
человека не столько в терминах его фактического поведения, а скорее, в тер­
минах предпочитаемых черт характера (см., например, D’A ndrade, 1965).
Подобное предубеждение может происходить в воспроизведении социаль­
ного поведения, так как люди такж е используют конструкты и схемы при
столкновении с новыми ситуациями или когда их просят сделать прогноз
относительно будущего. Н апример, ученый может прогнозировать способ­
ность друга вы йти из тяж елой ситуации на основе того, насколько он умен,
в то время к а к , спортсмен мож ет прогнозировать способность того ж е само­
го друга вы йти из ситуации на основе того, как быстро друг бегает. Соответ­
ственно, использование правил, схем и персональных конструктов, может
привести к выводам, что человек, который не разделяет те ж е самые когни­
тивны е структуры , не справится.
Возможно, наиболее интригую щ ий пример влияния долгосрочных схе­
м атических структур на восприятие данны х обеспечивается явлением сте­
реотипов. О жидание, что человек поведет себя определенным образом, мо­
ж ет вести к выводам, что человек уж е повел себя так. Стереотипы - это осо­
бые виды ож иданий, которые могут работать таким образом, чтобы форми­
ровать действительность, и они могут делать это, по крайней мере, частич­
но, с помощью предубеждения доступности. Гамильтон и Роуз (H am ilton и
Rose, 1978), проверяли эту возможность в исследовании стереотипов. В од­
ном исследовании, испытуемым предлож или списки предложений, напри­
мер, “Кэрол, библиотекарь, привлекательна и серьезна.” В каж дом предло­
ж ении представитель профессии был описан к ак обладающ ий двумя черта­
ми. Н екоторые черты носили стереотипную ассоциацию с профессией к ак,
например, в случае черты “серьезный”, с профессией “библиотекарь”; в дру­
гих случаях, черты не были стереотипными для этого занятия (как, напри­
мер, “привлекательны й” для библиотекаря), но они были стереотипными
для другой профессии (как, например “привлекательны й” для стюардессы).
Во всех предлож ениях каж дая черта была соединена с каж дой профессией
одинаковое число раз. К аж дая черта бы ла соединена со стереотипной про­
фессией в одной трети случаев и с не-стереотипными профессиями в двух
третьих случаев. Однако когда испытуемых просили оценить количество
раз, когда каж дая черта описы вала представителя каж дой профессии, они
не верно вспоминали пары черта характер-профессия, отдавая предпочте­
н ия стереотипными ассоциациями. Н апример, они с большей вероятностью
вспоминали, что библиотекари серьезны чем, что официантки серьезны.
Х отя мотивационные ф акторы могут предложить объяснение этих состо­
яний, они, вряд ли, это сделают. Н екоторые стереотипы могут заметно фи­
гурировать в потребностях человека и целях, но стереотипы профессий, та­
ки х к ак оф ициантка или библиотекарь, довольно банальны и вероятно, не
фигурирую т. Соответственно, эти результаты лучш е понимаю тся к ак ког­
нитивное явление. Эвристика доступности обеспечивает одно из возможных
Предубеждение доступности в социальном ... 229
объяснений, предполагая, что, когда испытуемых спраш иваю т, к ак часто
черта характера и профессия соединены, они оценивают частоту, исполь­
зуя силу ассоциации между профессией и чертой; во многих обстоятельствах
ассоциации сильнее после многих соединений в пары. Однако, в этом слу­
чае, имеется предубеждение в силе ассоциативной связи на основании сте­
реотипной ассоциации между некоторыми из пар черта характера - профес­
сия. Соответственно, так к ак эти ассоциации более сильные, воспринимаю­
щ ий оценивает, что эти черты характера и профессия более часто объедине­
ны чем, нестереотипные пары черта характера-профессия. Опять ж е, соци­
альные значения этого вида предубеждения огромны. Стереотипы, когда-
то сформированные, могут искаж ать сбор и хранение информационных и
последующ их впечатлений. Последствием является то, что необоснованные
выводы относительно социальных групп или людей могут навсегда сохра­
ниться без какого-либо эмпирического основания.

В ы вод ы
Н есколько прош едш их десятилетий изменили точку зрения на оценки как
результаты рационального, логического принятия реш ения, искаж енного
случайным присутствием иррациональны х потребностей и мотивов к рас­
смотрению человека к ак пользователя эвристики. Эмпирическая работа над
не-социальными оценками показы вает, что субъект использует сокращ е­
ния или эвристику, чтобы освободить место и передавать информацию на­
столько быстро, насколько возможно, и недавние исследования в области
социальной психологии предполагает, что эти процессы такж е обращ аются
к формированию и использованию социальных оценок. Л егкость, с кото­
рой примеры или ассоциации приходят в голову, обеспечивает оценку по­
добия (то есть, частоту или вероятность), которая в свою очередь обеспечи­
вает основание для создания других социальных оценок, таких к ак оценки
другого человека, причинная атрибуция или приписывание ответственнос­
ти, описание признаков другого человека, отнесение других людей к кате­
гории или описание себя.
Н аблю дательный критик обратит внимание, что в представленных ис­
следованиях свидетельство для использования эвристики доступности яв ­
ляется скорее логически выведенным, чем прямы м, и можно требовать бо­
лее ясного свидетельства, что именно легкость, с которой примеры или ас­
социации приходят в голову, ф актически опосредует оценки. Имеются не­
сколько причин для неопределенности. Во-первых, в отличие от когнитив­
ного исследования доступности, ни одно из этих социальных исследований
не было предназначено для исследования доступности к ак таковой; скорее,
каж дое было предназначено, чтобы объяснить некоторое интересное соци­
альное явление, и эвристика доступности применялась к ак одно из несколь­
ких возмож ны х объяснений явления. Во-вторых, не существует пока еще
согласованного измерения доступности. Некоторые исследования исполь­
230 ДОСТУПНОСТЬ
зовали скорость, с которой информация восстановливается в пам яти как
меру доступности (см. Pryor& K riss, 1977), в то время к ак другие исследова­
н ия рассматривали объем вспомненной информации как коэффициент дос­
тупности информации (см. Ross & Sicoly, 1979,12). Так к ак эти две меры не
всегда хоропхо коррелирую т (см. P ryor и K riss, 1977), двусмысленность и з­
мерения препятствовала эмпирическому прогрессу.
Часть этой проблемы измерения, однако, является спорной из-за третьей
проблемы, а именно, концептуальной двусмысленности, касаю щ ейся ис­
пользования термина доступность. И меется тривиальны й смысл, в кото­
ром весь социальный вывод обусловливается доступностью; оценки всегда
основаны на том, что приходит на ум. Это использование термина доступ­
ность должно отличаться от использования эвристики доступности с помо­
щью ясны х критериев для определения, действительно ли эвристика дос­
тупности бы ла задействована и к ак она была задействована, и действитель­
но ли доступность примеров или ассоциации является посредником после­
дующ их оценок. Социальные психологи имели тенденцию сосредотачивать­
ся на том, какая инф ормация является доступной и почему; увеличение
масш табов социального объяснения требует перенаправления усилий на то,
как эвристика доступности связы вает содержание того, что является дос­
тупным когнитивной обработке.
Влияние концепции доступности на социальную психологию, тем не ме­
нее, было большим по нескольким причинам. Во-первых, она вы двигает на
первы й план ош ибки в обработке, которые могут быть поняты , не обращ а­
ясь к мотивационным конструкциям . Это не говорит о том, что воздействие
мотивов на оценки незначительно, но просто указы вает на то, что главны е
ош ибки в познании такж е существуют. Во-вторых, хотя рациональные тео­
рии обеспечили полезные нормативные модели, с которыми ф актические
суж дения могут быть сравнены, отклонения от этих моделей настолько обыч­
ны и явны , что необходимы описательные модели. В примерах, приведен­
ны х здесь, такж е к ак во многих других, эвристика доступности обеспечила
одно из возмож ны х описаний. При некоторых обстоятельствах, использо­
вание эвристики доступности приводит к уместным заклю чениям; однако,
при тех обстоятельствах, где имеется предубеждение относительно того,
к а к а я инф ормация является доступной, следуют лож ные выводы. Опреде­
ленно, предубеждения заметности, предубеждения воспроизведения и пре­
дубеж дения, возникаю щ ие из-за познавательны х структур, таких к ак схе­
мы , убеж дения и ценности, могут приводить к повыш енной доступности
неправильной или вводящ ей в заблуждение информации в задачах соци­
альны х оценок.
У читы вая, что предубеждения доступности могут быть весьма распрост­
ранены , почему ж е используется эвристика доступности? Одна из очевид­
ны х причин - то, что она производит больше правильны х, чем неправиль­
ны х ответов, и в смысле затрат/вы годы , она имеет преимущ ество, экономя
время и энергию . Второй ответ - то, что многие ош ибки в выводах, произве­
Предубеждение доступности в социальном ... 231
денных эвристикой доступности, не будут иметь значение. Например, если
искаж енны е впечатления не повлияю т на будущее функционирование, к ак
при формировании неправильного впечатления о человеке, который встре­
чается только один раз, предубеждение будет иметь мало значения. Преду­
беждение доступности мож ет иметь мало значения, если оно постоянно в
течение некоторого времени. Н апример, если Вы расцениваете руководите­
ля к ак грубияна, не имеет значения то, что он грубый только когда, нахо­
дится в этой роли, если это единственное обстоятельство, при котором чело­
век взаимодействует с ним. Третий ответ - то, что многие ошибки могут быть
исправлены . Если предубеждение доступности не исчезает само со време­
нем, процесс начнет еамоисправляться с каж ды м новым случаем. Н апри­
мер, если несколько друзей одного человека недавно развелись, оценка про­
порции развода может быть временно преувеличена, но если друзья не про­
должаю т разводиться, оцененная пропорция развода долж на, в конечном
итоге, совпасть с объективными данными. Н аконец, в некоторых случаях,
ош ибка будет обнаружена по средством общ ения. Н апример, если утверж ­
дение, что человек сделал некоторую часть работы по дому, сталкивается с
серьезными возраж ениями со стороны супруга (супруги), то позиция, веро­
ятно, будет изменена. Короче говоря, обычное социальное общение обеспе­
чивает основание для испы тания выводов, и очевидно лож ные заклю чения
с далеко идущ ими значениями, вероятно, будут исправлены.
Но ошибочное восприятие с серьезными последствиями, при некоторых
обстоятельствах могут сохраняться. Н апример, к ак исследования стерео­
типов иллю стрирую т, если имеется предубеждение в формировании суж ­
дения, это может, в свою очередь, привести к предубеждениям в сохране­
нии этой оценки с помощью сформировавш ейся познавательной структуры
(в этом данном случае, стереотипа). Эти “сопутствующие” или дополняю­
щ ие друг друга предубеждения могут быть высоко устойчивыми к опровер­
жению . Существуя, они могут иметь разруш ительное влияние к ак на инди­
видуальны е восприятие, так и на социальную политику. Короче говоря,
нельзя считать предубеждения доступности несущ ественными, и соответ­
ственно, необходимы стратегии для обнаружения и исправления искаж ен­
ны х выводов.
14. Эвристика моделирования*

Даниелъ Канеман и Амос Тверсии

Н аш е первоначальное трактование эвристики доступности (T versky и


K ahnem an, 1973, 11) описывает два класса умственных действий, относя­
щ ихся к процессу “активизации в пам яти” (bring th ings to m ind): припоми­
нания случаев и конструирования примеров или сценариев. Вспоминание
и конструирование - весьма различны е способы “активизации в пам яти”;
они использую тся в качестве ответа на различны е вопросы и подчиняю тся
различны м правилам. Предыдущее исследование было сосредоточено глав­
ным образом на припоминании, а процессом умственного конструирования
пренебрегли.
Чтобы способствовать процессу изучения доступности для конструиро­
вани я, мы в общих чертах опишем умственное действие, которое обозна­
чим к ак эвристику моделирования. Мы начнем с обычного самоанализа:
каж ется, сущ ествует много ситуаций, в которы х на вопросы о событиях
можно ответить с помощью мыслительной операции, которая имеет сход­
ство с имитационной моделью. М оделирование мож ет ограничиваться и
управляться несколькими способами: стартовые состояния для “функцио­
нирования” могут оставаться при их реальны х изначальны х значениях или
изм еняться так, чтобы принять некоторое непредвиденное значение; исхо­
ды могут не указы ваться, или ж е может быть установлено целевое состоя­
ние, с условием нахож дения способа приближ ения к этому состоянию от
первоначальны х условий. М оделирование не обязательно подразумевает
наличие единственной истории, которая стартует с начала и заканчивается
определенным исходом. Скорее, мы рассматриваем результат моделирова­
н ия к ак оценку легкости, с которой модель мож ет производить различны е

* Эта глава взята из лекции Катца и Ньюкомба по социальной психологии “О психологии


возможных миров”, Энн Арбор, Мичиган, апрель, 1979. Работа была поддержана Службой
Военно-морских исследований согласно Контракту N00014-79-C-0077 со Стэндфордским
университетом.
Эвристика моделирования 233
исходы , учиты вая ее начальны е состояния и операционные параметры .
Таким образом, мы предполагаем, что ментальное моделирование опреде­
ляет меру, в которой чья-либо модель ситуации может генерировать раз­
личные исходы, такж е как возможности статистической модели могут быть
оценены методами М онте-Карло. Л егкость, с которой модель системы дос­
тигает определенного состояния, в конечном счете, используется для оцен­
ки способности (реальной) системы произвести это состояние.
Мы докажем, что оценки способности и вероятности, выведенные из мен­
тального моделирования, используются в нескольких задачах оценивания, а
такж е что они играют существенную роль в некоторых эмоциональных со­
стояниях. Сначала мы перечислим некоторые оценочные действия, в кото­
ры х, по-видимому, используется ментальное моделирование. Затем мы опи­
шем исследование когнитивных правил, которые управляю т умственным
аннулированием прош лых событий. И мы кратко обсудим значения этих
правил для эмоций, которые возникают, когда реальность сравнивается с аль­
тернативой, которая пользуется одобрением, но которую человек не смог до­
стигнуть, хотя мог легко вообразить, как он это сделает. Мы завершаем крат­
кий набросок по эвристике моделирования замечаниями по сценариям и пре­
дубеждениям, которые, вероятно, возникнут, при использовании этой эври­
стики.
1. Прогнозирование. Вообразите первую встречу двух человек, которых
вы хорошо знаете, но которые никогда раньш е не встречались. К ак Вы де­
лаете такие прогнозы, к ак “Они хорошо поладят” или “Они будут раздра­
ж ать друг друга”?
2. Оценка вероятности определенного события. К ак Вы оцениваете ве­
роятность вооруженного вмеш ательства американцев для обеспечения бе­
зопасности на месторождениях нефти в Саудовской А равии в следующем
десятилетии? Обратите внимание на различие между этой задачей и преды­
дущ ей. М оделирование в данном случае имеет указанное целевое состоя­
ние, и ее цель состоит в том, чтобы получить меру “легкости”, с которой это
целевое состояние может быть произведено в пределах ограничений реали­
стичной модели международной системы.
3. Оценка условных вероятностей. Если граж данская война начнется в
Саудовской Аравии, какие будут вероятные последствия? Обратите внима­
ние, что это упражнение моделирования отличается от простого прогнозиро­
вания, потому что оно включает указанное начальное состояние, которое мо­
ж ет отклоняться в большей или меньшей степени от существующей действи­
тельности. Оценка отдаленных последствий, в частности, вызывает интерес­
ную двусмысленность: какие изменения должны быть сделаны в текущ ей
модели до “функционирования”? Нужно ли делать только минимальные и з­
менения, которые включают указанное непредвиденное обстоятельство (на­
пример, граж данская война в Саудовской Аравии), подчинись элементарным
требованиям последовательности? И ли нужно представлять все изменения,
которые становятся вероятными за счет этого условия? В этом случае, напри­
234 ДОСТУПНОСТЬ
мер, модель политической системы была бы сначала установлена таким об­
разом, чтобы граж данская война в Саудовской Аравии стала само собой разу­
меющ ейся, и моделирование будет использовать параметры пересмотренной
модели.
4. Оценки, основанные на противоположных фактах. Н асколько уче­
ные Гитлера приблизились к созданию атомной бомбы во время Второй ми­
ровой войны? Если бы они создали ее в феврале 1945, изменился бы резуль­
тат войны? О ценки, основанные на противоположных ф актах, такж е ис­
пользую тся во многих повседневных рассуж дениях, к ак , например, в пред­
лож ении “она могла бы реш ить проблему с работой, если бы ее ребенок не
был болен”.
5. Оценки причинной связи. Чтобы проверить породило ли событие А со­
бытие В, мы можем мысленно отменить событие А, и посмотреть, происхо­
дит ли В все еще в модели. М оделирование может такж е использоваться для
проверки, увеличило ли событие А вероятность В, возможно даж е сделало
В неизбежным. Мы предполагаем, что испытание причинной связи моде­
лированием вклю чено в такие примеры , как “Вы очень хорошо знаете что,
они поссорились бы, даже если она не упомянула бы его м ать”.

И сследования отмены действий


Н аш и первоначальные исследования эвристики моделирования сосредота­
чивались на оценках, основанных на противоположных ф актах. В частно­
сти, нас интересовал процесс, на основании которого люди говорят, что со­
бытие “почти произош ло”. Пространственная метафора убедительна и была
принята во многих философских исследованиях: каж ется разумным гово­
рить об отклонении действительности от некоторых некогда возможных,
но нереализованны х событиях. Психологическое значение этой оценки от­
клонения между тем, что случилось и что могло случиться, проиллю стри­
ровано в следующем примере:
Г-н Крейн и г-н Тис должны покинуть аэропорт по расписанию на различных рейсах в
одно и то же время. Они выехали из города в одном и том же лимузине, попали в проб­
ку, и прибыли в аэропорт через 30 минут после намеченного времени вылета их самоле­
тов.
Г-ну Крейну сказали, что его самолет улетел вовремя.
Г-ну Тису сказали, что его рейс был задержан и вылетел 5 минут назад.
Кто больше расстроен?
Г-н Крейн Г-н Тисс

Н еудивительно, что 96% выборки студентов, которые отвечали на этот воп­


рос, заявили, что г-н Тис будет больше расстроен. Что ж е делает стереотип
столь очевидным? Обратите внимание, что объективная ситуация этих двух
господ абсолютно идентична, поскольку оба опоздали на свои самолеты.
Кроме того, так к ак оба ож идали опоздания, различие между ними не мо­
ж ет быть приписано разочарованию. Вообще, различие между Тисом и Крей­
Эвристика моделирования 235
ном несущественно. Единственная причина для большего расстройства г-
на Тиса - то, что у него была больш ая “возможность” успеть на свой само­
лет. Мы предполагаем, что стандартный эмоциональный сценарий для этой
ситуации - это привлечение двух путеш ественников в упраж нение модели­
рования, в котором они проверяю т, насколько они были близки к тому, что­
бы успеть на самолет. Конструирование, основанное на противоположных
ф актах, действует таким ж е образом, как и ожидание. Х отя из истории ясно,
что ож идания г-на Тиса и г-на Крейна не могли быть различны ми, г-н Тис
теперь больше разочарован, потому что ему легче вообразить, к ак он мог бы
прибыть на 5 минут раньш е, чем г-ну Крейну вообразить, к ак этой задерж ­
ки на 30 минут можно было бы избеж ать.
Такие примеры напоминаю т А лису в Стране чудес, с их странной смесью
ф антазии и действительности. Если г-н Крейн способен вообразить едино­
рогов, а мы думаем, что это так, почему он считает относительно трудным
представить, что ему удалось избеж ать 30-минутной задерж ки? Очевидно,
имеются ограничения свободы ф антазии, и психологический анализ мен­
тального моделирования состоит, преж де всего, в исследовании этих огра­
ничений.
Н аш е знание правил ментального моделирования все еще находится в
зачаточной стадии, и мы можем представлять только ранние результаты и
предварительные предположения в области, которая каж ется исклю читель­
но богатой и обещающей. Мы получили предварительные наблю дения от­
носительно правил, которые управляю т специальны м классом деятельнос­
ти моделирования - отмена прошлого. Н аш и исследования отмены собы­
тий сосредоточились на ситуации, в которой эта деятельность является осо­
бенно обычной - реакция вы ж ивш их родственников на несчастный случай
со смертельным исходом. И опять ж е, к ак в случае г-на Тиса и г-на Крейна,
мы хотели исследовать то, что мы назы ваем эмоциональным сценарием си­
туации. Д ля примера, рассмотрим следующую историю:
Г-ну Джонсу было 4 7 лет, он отец троих детей и успешный банковский администратор.
Его жена оставалась дома из-за болезни в течение нескольких месяцев.
В день несчастного случая г-н Джонс уехал из своего офиса в обычное время. Он иног­
да уезжал рано, чтобы заниматься домашними делами по просьбе его жены, но в этом
не было необходимости в тот день. Г-н Джонс не поехал домой своим обычным маршру­
том. День был исключительно ясным, и г-н Джонс сказал своим друзьям в офисе, что
он поедет вдоль берега и будет наслаждаться видом.
Несчастный случай произошел на главном перекрестке. Когда подъехал г-н Джонс,
загорелся желтый свет. Свидетели отметили, что он резко затормозил, чтобы остано­
виться на перекрестке, хотя мог легко проехать. Его семья признала, что это было при­
вычной манерой вождения г-на Джонса. Когда он начал пересекать перекресток после
изменения света, малотоннажный грузовик влетел на перекресток на высокой скорос­
ти и протаранил автомобиль г-на Джонса слева. Последний умер мгновенно.
Позже было установлено, что грузовик вел мальчик-подросток, находящийся в со­
стоянии наркотического опьянения.
Как обычно случается в таких ситуациях, семья г-на Джонса и их друзья часто ду­
мали и говорили: “Если бы только... “, в течение нескольких дней, после несчастного
236 ДОСТУПНОСТЬ
случая. Как они продолжали эту мысль? Пожалуйста, предложите одно или более про­
должений предложения.

Эта версия (обозначенная к ак версия “марш рута”) бы ла дана 62 студен­


там Колумбийского университета. Д ругая группа из 61 студента получила
версию “времени”, в которой второй абзац был следующим:
В день несчастного случая, Г. Джонс уехал из офиса ранее, чем обычно, чтобы выпол­
нить работу по дому по просьбе его жены. Он ехал домой по своему обычному маршру­
ту. Г-н Джонс иногдаездил вдоль берега, чтобы наслаждаться видом в особо ясные дни,
но тот день был совершенно обычным.

А нализ данны х, полученных при первом заполнении образца “Если бы


только”, дается в табл Л . Бы ли получены четыре категории ответа: (1) отме­
на марш рута; (2) отмена времени отъезда из офиса; (3) пересечение перекре­
стка на ж елты й свет; (4) удаление из сценария м альчика в состоянии нарко­
тического опьянения.

Таблица 1.Анализ первого заполнения образца “если бы только”

Кат егории от вет а Версия "времени” Версия "м арш рут а "
(1) маршрут 8 33
(2) время 16 2
(3) пересечение 19 14
перекрестка
(4)мальчик 18 13
(5) другое 1 3

Особенно внуш ительная сторона результатов, показанны х в табл. 1 - этс


событие, которое не произойдет: ни один испытуемый не упомянул, что, если
бы г-н Джонс приехал на перекресток на две или три секунды ранее, он про­
ехал бы благополучно. Типичный вывод: события мысленно не отменяются
с помощью произвольных изменений в значениях непрерывных перемен­
ны х. Очевидно, испытуемые не выполняю т задачу отмены событий, устра­
н яя необходимое условие критического события, которое имеет самую низ­
кую предполагаемую вероятность - процедура, которая привела бы их к
тому, чтобы сосредоточиться на экстраординарном совпадении того, что эти
два автомобиля встретились на перекрестке. Что бы тогда люди не делали,
это не связано с априорной вероятностью.
И зменения, которые люди вклю чаю т в истории, могут классифициро­
ваться к ак нисходящ ие, восходящ ие или горизонтальны е. Н исходящ ие
изменения - те, которые отменяю т неож иданны й аспект истории или ина­
че увеличиваю т ее внутреннюю последовательность. Восходящие измене­
ния - те, которые вносят маловероятные случайности. Горизонтальные из­
м енения - те, в которых произвольное значение переменной заменено дру­
Эвристика моделирования 237
гим произвольным значением, которое не является ни более, ни менее веро­
ятны м , чем первое. Экспериментальная манипуляция заставила изменение
марш рута быть нисходящ им в одной версии, восходящ им в другой, с соот­
ветствующим разнообразием в характере изменения времени фатальной по­
ездки г-на Джонса. М анипуляция была успешна: испытуемые прогнозиро­
вали, что несчастный случай не произойдет, восстанавливая нормальное
значение переменной, а не проводя исклю чение. Вообще, восходящ ие изме­
нения относительно редки в ответах испытуемых, а горизонтальных изме­
нений не было.
П онятие восходящ их и нисходящ их изменений заимствовано из опыта
лы ж ника, едущего по пересеченной местности, и предназначено для иллю ­
страции особого характера расстояния, которое мож ет быть определено для
возмож ны х состояний системы. Существенная особенность этого отнош е­
ния - то, что оно не симметрично. Д ля лы ж ника, едущего по пересеченной
местности, краткий спуск от А до В часто сопровождается длительным и
трудоемким подъемом от В до А. В этой метафоре, исклю чительные состоя­
н ия или события - горы, нормальные состояния или события - равнины.
Таким образом, мы предполагаем, что психологическое расстояние от ис­
клю чения до нормы, которую оно наруш ает, меньш ее, чем расстояние от
нормы до того ж е исклю чения. Предпочтение нисходящ их изменений - это
возможно, главное правило, которому подчиняется ментальное моделиро­
вание; оно олицетворяет существенные ограничения, которые придают ре­
ализм ф антазиям , основанным н а противоположных ф актах.
И звестный аспект результатов, показанны х в табл. 1 - относительно низ­
к ая пропорция ответов, в которы х несчастный случай отменяется за счет
устранения случая, который естественно рассматривается к ак его причи­
на, например, безумное поведение принявш его наркотики мальчика-под-
ростка на перекрестке. Этот вывод иллю стрирует другую особенность мен­
тального моделирования, которое мы назовем правилом фокуса: истории
обычно перерабатываю тся за счет изменения некоторого свойства объекта,
находящ егося в центре вним ания. В данном случае, конечно, центром вни­
м ания был г-н Джонс, так к а к испытуемых попросили сочувствовать его
семье. Чтобы проверить правило ф окуса, новая версия истории несчастного
случая была построена таким образом, что последний абзац был заменен сле­
дующей информацией:
Как был позже установлено, грузовик вел мальчик-подросток, по имени Том Сирлер. Отец
Тома только что обнаружил его дома в состоянии наркотического опьянения. Это было
обычное явление, поскольку Том давно и постоянно принимал наркотики. Произошла
ссора, в результате которой Том схватил ключи, которые находились на столе в гости­
ной, и поехал на грузовике в бессознательном состоянии. Он был серьезно ранен в резуль­
тате несчастного случая.

И спытуемых, которым предоставили эту версию истории, попросили закон­


чить образец “Если бы только...” либо от имени родственников г-на Д ж он­
238 ДОСТУПНОСТЬ
са, либо от имени родственников Тома. Тут тоже, мы рассматриваем пер­
вый ответ, данный испытуемыми. Больш инство испытуемых, которые при­
няли роль родственников Тома (68% ), изменили историю, исклю чив Тома
из сцены несчастного случая - наиболее часто, не позволяя фатальным клю ­
чам леж ать на столе. Н апротив, меньш инство (28% ) испытуемых, приняв­
ш их роль родственников г-на Джонса, упомянули Тома в своих ответах.
Мы описали это исследование отмены событий достаточно подробно, не­
смотря на его предварительный характер, чтобы проиллю стрировать уди­
вительную точность правил, которые управляю т ментальным моделирова­
нием, и продемонстрировать сущ ествование распространенных норм ф ан­
тазий, основанных на противоположных ф акторах, которые являю тся уме­
стными в некоторых ситуациях. Мы полагаем, что когнитивны е правила,
которые управляю т легкостью умственной отмены событий, будут полезны
в изучении ряда эмоций, которые могут назы ваться эмоциями, основанны­
ми на противоположных ф актах, из-за их зависимости от сравнения дей­
ствительности с тем, что могло бы или должно было быть: расстройство, со­
ж аление и некоторые случаи негодования, печали и зависти. Общей чертой
этих эмоциональных состояний является то, что у человека гедонический
уровень адаптации вы ш е, чем его реальность, к ак будто неосуществленные
возможности придали значимость уровню адаптации, с помощью веса, со­
ответствующего легкости, с которой эти возможности достигаю тся при мен­
тальном моделировании.

Зам етки по сценариям


В контексте прогнозирования и планирования в условиях неопределеннос­
ти, нам еренная м анипуляция умственными моделями является достаточ­
но важ ной, чтобы заслуж ить название эвристики характерного моделиро­
вания. Самый яркий пример таких действий - явное воспроизведение сце­
нариев к ак процедуры оценки вероятностей.
Что делает сценарий хорошим? В терминах, уже представленных, хоро­
ш ий сценарий - тот, который соединяет промежуток между начальным со­
стоянием и целевым событием с помощью ряда промежуточных событий, с
общей нисходящ ей тенденцией и без существенных подъемов. Неофициаль­
ные наблю дения свидетельствую т, что правдоподобие сценария зависит
намного больше от правдоподобия его самой слабой связи, чем от числа свя­
зей. Сценарий особенно хорош, когда путь, который ведет от начального к
последующему состоянию, не является очевидным, так, чтобы введение про­
меж уточны х стадий ф актически усилило субъективную вероятность целе­
вого события.
Любой сценарий - обязательно схематичный и неполный. Поэтому инте­
ресно обнаружить правила, управляю щ ие выбором событий, которые явно
определены в сценарии. Мы выдвигаем гипотезу, что “узлы ” сценария - это
события, у которых низкая избыточность и высокое причинное значение. Не
Эвристика моделирования 239
избыточный случай представляет локальны й минимум в предсказуемости
последовательности, точку, в которой существенные альтернативы могли бы
возникнуть. Причинно значимый случай - это тот, возникновение которого
изменяет величины, которые считаются нормальными для других событий в
цепочке, которая, в конечном счете, ведет к цели сценария.
Разработка единственного вероятного сценария, который ведет от реа­
листических начальны х состояний к указанному конечному состоянию,
часто используется для поддерж ания оценки, что вероятность конечного
состояния является высокой. С другой стороны, мы склонны делать вывод,
что исход является маловероятным, если он может быть достигнут только с
помощью восходящ их предположений о редких событиях и странных со­
впадениях. Таким образом, оценка “соверш енства” сценариев может быть
эвристикой для оценки вероятности событий. В контексте планирования, в
частности, сценарии часто использую тся для оценки вероятности, что план
будет удачным и риска возникновения различны х причин неудачи.
Мы предположили, что воспроизведение сценариев используется в каче­
стве эвристики для определения вероятности событий посредством оценки
способности некоторой причинной системы породить эти события. Подобно
любой другой эвристике, эвристика моделирования должна быть подверже­
на характерны м ошибкам и предубеждениям. Проведено мало исследований
в этой области, но появляю тся следующие гипотезы, убеждая, что: (i) поиск
не избыточных и причинно значимых “узлов” в построении сценария приве­
дет к предубеждениям для него (и конечных состояний), в котором драмати­
ческие события обозначают причинные переходы; будет наблюдаться тенден­
ция недооценивать вероятность событий, произведенных медленными и воз­
растающ ими изменениями; (ii) использование сценариев для оценки вероят­
ности связано с предубеждением в пользу событий, для которых вероятный
сценарий может быть найден, с соответствующим предубеждением против
событий, которые могут быть порождены множеством маловероятных спо­
собов. Такое предубеждение может иметь особенно пагубные последствия в
контексте планирования, потому что оно производит чрезмерно оптимисти­
ческие оценки вероятности того, что план будет осуществлен. По своему ха­
рактеру, план состоит из цепи вероятных связей. В любой точке цепи, имеет
смысл ож идать, что события развернутся, как было запланировано. Однако,
совокупная вероятность по крайней мере одной фатальной неудачи может
быть чрезвычайно высока даж е, когда вероятность каж дой индивидуальной
причины неудачи ничтожно мала. П ланы руш атся из-за сюрпризов, случа­
ев, в которых происходит неожиданное восходящее изменение. Эвристика
моделирования, которая искаж ается в пользу нисходящ их изменений, свя­
зана с риском больших и систематических ошибок.
Часть V
Ковариация и контроль
15. Субъективная оценка ковариации: суждения,
основанные на данных против суждений, основан­
ных на теориях*

Денис Л. Дженнингс, Тереза М. Эмабайл и Ли Росс

Протекание социального опыта часто ставит перед нами задачу узнавания


эмпирических ковариаций. Иногда, эти ковариации - просто испытание на­
ш их способностей к наблюдению и не несут никакого непосредственного прак­
тического интереса для нас. С другой стороны, например, когда эти ковариа­
ции включаю т первые признаки проблем и более поздние проявления, или
используемые поведенческие стратегии и полученные исходы, или относи­
тельно открытые характеристики людей или ситуаций, а такж е относитель­
но скры ты е - такие способности обнаружения помогают определять наш ус­
пех в приспосабливании к требованиям повседневной социальной ж изни. Во­
обще, обнаружение ковариации будет играть важную роль в наш ей продол­
жительной борьбе как “интуитивных ученых” (см. N isbett и Ross, 1980; Ross,
1977,1978), чтобы оценить и усовершенствовать имеющиеся гипотезы отно­
сительно нас самих, других людей и нашего общества. Очевидный вопрос,
поэтому, звучит так: насколько опытны мы как обыватели, при оценке эмпи­
рических ковариаций, представленных в нашем опыте?

*Мы хотим поблагодарить профессоров Даниела Канемана, Амоса Тверского и Пола Слови-
ка за их полезные комментарии и предложения. Мы также хотели бы отметить большие
усилия Риты Френч и Джулии Стейнмец, которые принимали участие в исследовании, о
котором сообщается здесь. Исследование было поддержано частично стипендией Нацио­
нальной научной организации первому автору, грантом Национального института психи­
ческого здоровья МН-26736 и грантом Национальной научной организации BNS-78-01211
Ли Россу и Марку Лепперу.
Организация и содержание этой главы появились благодаря более раннему исследованию
этой же темы Л. Россом и Р. X. Нисбеттом в книге “Предположения людей: Стратегии и
недостатки социальных оценок” (Human Inference: Strategies and Shortcomings of Social
Judgment), Prentice-Hall, Inc., 1980.
+Ковариация - (от англ, covariation) совместная изменчивость, взаимосвязь переменных
величин (прим, редактора).
244 КОВАРИАЦИЯ И КОНТРОЛЬ
Перед тем, к ак начать обсуждение прошлого или настоящего исследова­
ния, мы должны обратить внимание, что каждодневное наблюдение обеспе­
чивает нас большим количеством данных; и это наводит на мысль, что ответ
на вопрос об опыте может быть далеко не простым. С одной стороны, и адап­
тивный характер социального поведения, и гармоничное качество социаль­
ного взаимодействия не оставляет сомнений в том, что представители нашей
культуры обладают глубокой проницательностью относительно причин и
последствий поведения. Ф актически, современные теоретики атрибуции (на­
пример, Jones и др., 1971; Kelley, 1967, 1971,1973; W einer, 1974), которые
интересовались основаниями для такой проницательности, рассматривали
способность обнаружить ковариацию и перешли к логическому использова­
нию таких воспринятых ковариаций. С другой стороны, каждодневный опыт
такж е предлагает красноречивое доказательство существования необоснован­
ны х предубеждений, разрушительных поведенческих стратегий и других про­
явлений ошибочных причинных или корреляционных теорий. Очевидно, что
любое адекватное описание неофициальной оценки ковариации должно зат­
рагивать неоднородность поведения обывателя. Это должно, так или иначе,
урегулировать тонкую проницательность относительно некоторых функци­
ональных отношений и невежество или иллю зии о других.

Предшествующее исследование оценки ковариации


П римечательно, что даже самые верные защ итники способностей обывате­
лей к ак интуитивных ученых (например, Peterson & Beach, 1967) могли мало
хорошего сказать относительно того, к ак обыватели справляю тся с двумер­
ными наблюдениями. Мы рассмотрим две линии исследования, которые под­
держиваю т это нелестное описание, сосредотачиваясь в каж дом случае на
процедурных аспектах и результатах, которые окаж утся подходящ ими для
последующего описания наш его собственного исследования обывательской
оценки ковариации.

Толкование таблиц сопряженности: проблема “экологической ва­


лидност и “
Одно из важ ны х направлений предшествующего исследования посвящено
способности людей понимать функциональные связи, представленные в про­
стых 2x2 таблицах сопряженности. К ак правило, в этих таблицах суммиро­
валось количество случаев присутствия и отсутствия переменной X (напри­
мер, какая-либо болезнь), по сути связанной с наличием и отсутствием пере­
менной Y (например, какой-либо симптом). Так к ак двумерные данные были
аккуратно собраны и “рассортированы”, задача испытуемых была очень про­
ста и незамысловата. Однако, экспериментальные данные (например, Jenkins
& W ard, 1965; Sm edslund, 1963; W ard & Jen k in s, 1965) показы ваю т, что
необученные люди справлялись с такими задачами весьма плохо.
Субъктивная оценка ковариации... 245
Оценочные стратегии, игнорирую щ ие одну или более из четырех ячеек,
явились причиной большинства трудностей испытуемых. Одна из самых
распространенных неудач, например, вклю чает ф актически исклю читель­
ную уверенность о размере ячейки “наличие-наличие” относительно всей
совокупности. Таким образом, многие испытуемые, могут сказать, что симп­
том X связан с болезнью А , просто потому, что в таблице сопряженности
показано большое количество случаев, где присутствует и болезнь, и при­
знак. И спытуемые, обращающие внимание только на две из этих четырех
ячеек, могут ввестись в заблуждение. Заметив, например, что у больш ин­
ства больных людей скорее отсутствует симптом А, испытуемые могут зак­
лю чить, что соответствующие связи - отрицательные; или заметив, боль­
ш инство людей, у которых наблюдается симптом, больны, они могут сделать
вывод, что связи - положительные.
Без формального статистического обучения, однако, очень немного лю ­
дей оцениваю т ф акт, что правильны е выводы в таких случаях могут быть
сделаны только при рассмотрении всех четырех ячеек. Один из удовлетво­
рительны х методов, например, мог бы вклю чать сравнение пропорций (то
есть, сравнение пропорции больных людей, проявляю щ их специфический
признак, с пропорцией здоровых людей, проявляю щ их этот признак). Фор­
м альная стратегия, продиктованная современными работами по статисти­
ке, конечно, вклю чает рассмотрение всех четырех ячеек. Определенно, мож ­
но было бы потребовать от человека обратить внимание на несоответствия
между наблюдаемыми частотами ячейки и теми частотами, которые следу­
ет “ож идать” на основе соответствующих минимальны х частот или вероят­
ностей (таким образом, обеспечивая информацией, используемой для вы ­
числения статистики хи-квадрат).
С кептики, склонные отстаивать основания обывателей, могли бы почув­
ствовать соблазн отклонить такие проявления как свидетельство только того,
что люди плохо “оперируют” таблицами сопряженности и отстаивать то, что
ош ибки испытуемых в таких задачах являю тся, прежде всего, следствием
новизны задачи и искусственности. Отношения между лабораторными дей­
ствиями и каждодневной реальностью , то есть проблема “экологической
валидности”, являю тся важ ной проблемой, которую нельзя избеж ать в ис­
следовании, о котором говорится в этой главе. Давайте рассмотрим эту про­
блему в надеж де, что это предупредит и вооружит читателя необходимыми
сведениями.
С начала, уч и ты вая, что задача оперирования таблицам и бесспорно
необычна и экологически нетипична, заметим, что логика (и различны е ло­
гические недостатки), показанны е испытуемыми в этих лабораторных за­
дачах, соответствует логике, наблюдаемой в разнообразии каждодневных
выводов. Рассмотрим, например, вопрос, “Отвечает ли Бог на молитвы ?”
“Д а,” мож ет ответить необученный человек, которы й смотрит только на
ячейку “наличие - наличие”, “потому что много раз я просил Бога о чем-то,
и Он давал это мне”. Более искуш енны й и скептически настроенный чело­
246 КОВАРИАЦИЯ И КОНТРОЛЬ
век мож ет спросить, “Но как часто Вы просили, Бога о чем-либо и не полу­
чали этого? ” Сравнение двух ячеек, однако, все еще крайне неадекватно для
данной задачи на логику. Д аж е дополнение третьей ячейки, благоприятные
исходы, которые произош ли в отсутствии молящ егося, оставит проблему
нереш енной, поскольку необходимы все четыре ячейки прежде, чем осно­
вательны й вывод мож ет быть сделан. И даже наиболее искуш енный из ин­
туитивны х психологов, вероятно, оставил бы без вним ания предложения,
что данные из ячейки “отсутствие - отсутствие” (то есть, благоприятные ис­
ходы , о которых не просили и которые не произош ли) обязательны для оцен­
ки воздействия молитв на мирские исходы.
Н а обвинение в нерепрезентавивности можно ответить даже более убеди­
тельно. Если задача с таблицей из четырех ячеек создает некоторые уникаль­
ные проблемы, эта ж е задача такж е удовлетворяет большинство требований
испытуемых, которые усложняю т каждодневные оценки ковариации. Эти
требования изначально включают припоминание, кодирование, хранение и
восстановление соответствующих данных, а затем подготовку их в той фор­
ме, которая позволяет оценить ковариацию. Рассмотрим, например, человек,
который реш ается проверить стереотипное понятие, что рыжеволосые люди
являю тся вспыльчивыми (или, более точно, что наличие ры ж их волос поло­
жительно коррелирует с наличием вспыльчивого характера). Сначала, он
должен реш ить, какие данные должны быть рассмотрены. Попытается ли он
сделать выборку или вспомнить случаи вспыльчивых рыжеволосых людей?
И ли он должен рассмотреть некоторых рыжеволосых людей и обратить вни­
мание, насколько они вспыльчивы, или рассмотреть некоторых вспыльчи­
вы х людей и обращать внимание, сколько из них рыжеволосые? Очень веро­
ятно, он примет некоторую стратегию или комбинацию стратегий, не рассмат­
ривая возможность, что относительная частота уравновешенных брюнеток
могла быть уместной в данной логической задаче. Это положение дел не соот­
ветствует задаче с таблицей из четырех ячеек, которая делает все соответству­
ющие данные одинаково доступными для испытуемого, даж е если не требу­
ется, чтобы их все надлежащ им образом рассмотрели.
Предположим, что рассматриваемый человек, так или иначе признает, что
тестирование его стереотипа, требует, чтобы он рассмотрел данные во всех
четырех ячейках. К ак он должен сформировать соответствующую выборку
данных, и з которой он взял бы уместные частоты ячейки? Если он просто рас­
смотрит первое множество людей, которые приходят на ум? М ожет быть, ему
следует рассмотреть всех людей, принадлежащ их некоторому ограниченно­
му классу (например, члены его семьи, друзья или арендаторы в его доме)?
Или ему следует попытаться использовать некоторый “случайный” метод для
построения частных случаев из полной популяции? Потенциальные источ­
ники предубеждения в наиболее неофициальном методе формирования вы­
борки очевидны. Выборка из людей, которые первыми приходят на ум, мо­
ж ет привести к серьезны м предубеж дениям “доступности” (T versky и
K ahnem an, 1973,11). А выборки друзей или членов семьи или соседей, веро­
Субъктивная оценка ковариации... 247
ятно, проявят предубеждение, а такж е нарушение требования независимос­
ти (не тривиальная проблема, так как семья, друзья или даже соседи могут
разделять поведенческие тенденции, физические характеристики и даже со­
ответствия между ними). “Н овая” процедура с таблицей из четырех ячеек
помогает человеку, оценивающему ковариацию , реш ить задачу сопоставле­
н ия этих тупиковых и критических проблем.
Задачи кодирования данны х, их хранения и исправления добавляет мно­
жество дополнительных факторов и проблем в ежедневную оценку ковари­
ации. Вероятно, гипотеза, что рыжеволосые люди являю тся вспы льчивы ­
м и, мож ет искаж ать реш ения относительно того, кто является или не я в л я­
ется вспыльчивым, и чьи волосы являю тся или не являю тся ры ж ими. Эта
проблема рассматривается ниж е в этой главе. А сейчас давайте просто обра­
тим внимание, что предш ествующ ие ож идания или гипотезы вклю чаю т
потенциально искажаю щ ее влияние на каж дую стадию обработки инфор­
мации, влияние, которое устраняется, когда человеку предоставляются дан­
ные, для которы х процессы кодирования, хранения и восстановления уже
закончены . Давайте повторим, что такие ж изненны е препятствия к точной
оценке ковариации способны оказаться гораздо более устраш аю щ ими, чем
любые препятствия являю щ иеся результатом искусственности или неозна-
комленности с методологией таблицы сопряженности.

Ложная корреляция: воздействие предрассудков на восприятие


Н асколько успешно люди обращаются с двумерными распределениями, ког­
да соответствующие наблюдения представлены скорее индивидуально, чем
перераспределены в форме таблиц сопряженности? Многие из существующих
данных взяты из конструктивной работы Чепманов по ложной корреляции.
(Для детального рассмотрения этого исследования см. Chapman & Chapman,
1967,1969; такж е см. Главу 17, этого издания). Наш краткий обзор сосредо­
точивается на специфических проблемах и выводах, которые предоставляют
пространство для наш их собственных, более современных, исследований.
Возможно, самое простое резюме результатов Чепманов и выводы относи­
тельно способности испытуемых обнаружить ковариации между клиничес­
кими признаками и симптомами - это то, что ковариации, о которых было
сообщено, отражаю т истинные ковариации гораздо меньш е, чем предубеж­
дения относительно характера отношений, которые “должны” существовать,
основанные на теории или на семантике. В то время как эти выводы были
впечатляю щ ими, спорными и обладали непосредственной уместностью для
практика, то общее, что они сделали относительно эффектов предубеждений
по поводу наблюдаемых ассоциаций, было по существу знакомым.
К ак отмечал Чепмен в своей первоначальной работе (L .J. Chapm an, 1967),
ложные корреляции не ограничены областью клинических суждений. Боль­
ш инство предрассудков - это по сущ еству опытным путем необоснованные
убеждения относительно ассоциации меж ду специфическими действиями
248 КОВАРИАЦИЯ И КОНТРОЛЬ
или событиями и последующими положительными или отрицательными
исходами. Расовые, этнические, региональные, религиозные или профес­
сиональные стереотипы - это такж е убеждения относительно ковариаций,
убеж дения, которые настоятельно под держиваются и являю тся стойкими
к воздействию опровергающих данных (см. A dorno и др., 1950; A llport, 1954;
Р . G oldberg, 1968; J.M . Jones, 1972; Taynor & D eaux, 1973). Исследование
относительно “неявной теории личности” мож ет такж е быть приведено в
этом контексте. Более пятидесяти лет назад Торндайк (Thorndike) описал
так назы ваемы й эффект ореола, при котором воспринимаю щ ий ожидает и
сообщ ает об ассоциации всех полож ительны х характеристик личности.
Последующие исследователи (например, K oltuv, 1962; N orm an & Goldberg,
1966; P assini & N orm an, 1966) значительно расш ирили эту работу и иссле­
довали концептуальны е схемы и убеждения относительно личности, кото­
ры е располагаю т испытуемых сообщать о последовательных связях между
различны ми чертами характера или различными индикаторами одной и той
ж е черты , чьи эмпирические связи очень слабы или даж е не существуют.
Таким образом, сущ ествует большое количество эмпирических свиде­
тельств, что, в области оценки ковариации противоборство между ожида­
ниям и и сведениями мож ет быть неравным. Такж е к ак в других типах пер­
цептуальны х и когнитивны х оценок (ср. B runer, 1957а, 1957b; B runer,
Postm an, & R odrigues, 1951), предубеждения интуитивного ученого отно­
сительно эмпирических связей определяю т, что он обнаруживает, что ему
не удается найти, и что он видит такого, чего не сущ ествует. Такие поспеш­
ные выводы о превосходстве теории над данными могут привести нас к тому,
что мы не примем во внимание значимую неопределенность - или, нако­
нец, важ ны й нереш енный вопрос - в исследовании Чепманов. К примеру,
мы можем установить две отдельные проблемы об интуитивной оценке ко­
вариации, которые, в некотором смысле, смеш аны в этих и последующих
исследованиях (например, G olding & R orer, 1972, S tra rr & K atkin, 1969).
П ервая проблема касается трудностей, возникаю щ их у людей при обнару­
ж ении ковариации в непосредственно доступных данны х - то есть их спо­
собность узнать и оценить ковариации, когда они “не услож няю тся” теори­
ям и и объяснениями относительно рассматриваемых эмпирических связей.
Вторая проблема рассматривает тенденцию интуиции и теорий испытуемых
приводить их к тому, что они признаю т существование устойчивых корре­
ляций, где такие предположения опровергаются лучш ими “объективными”
сведениями.
Разделение этих проблем предполагает необходимость исследовать про­
ведение испытуемыми оценок ковариации в двух разны х заданиях. Первое
задание по своей сути “психологическое”, и оно дает сведения об отноше­
нии между субъективными оценками и объективными измерениями. В этом
задании испытуемым предлагается множества двумерных наблюдений, по
поводу которы х у них не может быть никакой предвзятой теории, а затем
их просят оценить силу связи в каж дом множестве. Исследователь затем
Субъктивная оценка ковариации... 249
должен попы таться измерить сложность каждого задания (в основном, от­
м ечая степень изменчивости, связанную с отдельными оценками) и опреде­
лить характер “психометрической” функции, соотнеся субъективные оцен­
ки и объективные измерения.
Второе задание касается оценок, совершенно противоположных оценкам,
которые основаны на данных; оно имеет отношение к оценкам, которые в це­
лом, или почти целиком, основаны на теории. Таким образом, пары перемен­
ных или измерения, которые могут быть связаны с интуицией испытуемых
или их теориями, должны быть определены, но исследователь не может пре­
доставлять никаких релевантных двумерных данных. Если испытуемым
предлагаются какие-либо данные в таких оценках, то они должны быть взя­
ты из ежедневного опыта или воспоминаний испытуемых; и, будучи таковы­
ми, они подвержены множеству “процессуальных” ошибок и предубеждений,
о которых мы упоминали ранее в наш ем обсуждении. С целью оценки и срав­
нения экспериментатор должен обладать средствами оценки точности или
природы ошибок, связанных с такими интуитивными оценками. То есть, у
него долж на быть некоторая “объективная” мера корреляции для каж дой
пары переменных, предоставленной испытуемым.

Э к сп ер и м ен тал ьн о е ср ав н е н и е о ц ен ок к о в а р и а ц и и , о сн о в ан н ы х н а
данн ы х и на теори ях

Недавно мы провели исследование, преследуя выш еупомянутые цели и ис­


пользуя вышеупомянутую базовую стратегию . Д ля задач, основанных на
данны х, были использованы три различны х типа двумерного распределе­
ния, которые будут подробно описаны в следующей главе. Д ля оценок, ос­
нованных на теории, были обозначены пары связанны х переменных, но
экспериментатор не предоставил н икаких ф актических данны х. Чтобы об­
легчить сравнение между оценками, основанными на данных и на теориях,
использовался внутригрупповой план, в котором испытуемые использова­
ли одинаковые ш калы субъективных оценок для обоих заданий (сбаланси­
рованные по порядку представления).
В каж дом случае в задачах релевантной оценки корреляции использова­
лись скорее непрерывные, чем дихотомические переменные (в отличие от
работы Chapm an & Chapm an, 1967, 1969 и Jenkins & W ard, 1965). Эта осо­
бенность была разработана для того, чтобы лучш е понять природу большин­
ства ежедневных задач оценивания.1

‘Наше изучение литературы выявило, что оценка ковариации с непрерывными перемен­


ными очень редко использовалась в предыдущих исследованиях. Исключением, обнару­
женным вэтом поиске, было одно исследование, к которому редко обращались (исследова­
ние Erlick, 1966; Erlick & Mills, 1967), которое касалось, в основном, влияния вариаций на
воспринятую соотнесенность; лишь немногие данные из этого исследования применимы для
настоящего исследования.
250 КОВАРИАЦИЯ И КОНТРОЛЬ
Задачи на оценивание
В этом эксперименте, организованном для сравнения оценок ковариации,
основанных на данны х и на теориях, участвовали в целом 64 студента стар­
ш их курсов Стэндфордского университета, причем ни один из них не окон­
чил курсов по статистике. Д ля обоих типов оценок испытуемые использо­
вали простую ш калу для описания своего субъективного впечатления о на­
правлении и силе связи между парами переменных. И спользуя эту ш калу,
испытуемые сначала оценивали, бы ла ли рассматриваемая связь полож и­
тельной или отрицательным. Затем они оценивали силу связи, помещ ая “X ”
на 100-бальной ш кале оценок, концы которой были помечены значениями
“полная связь” и “отсутствие связи”.
Оценки ковариации, основанные на данных. Одна часть эксперимента каса­
лась оценок ковариации, основанных на множествах двумерных наблюде­
ний, предоставленных экспериментатором. Чтобы создать релевантные дву­
мерные распределения было использовано три варианта стимульного мате­
риала. Д ля каж дого типа стимульного м атериала было создано множество
двумерных распределений, чтобы показать различны е объективные кова­
риации между двумя переменными. Испытуемых попросили изучить к аж ­
дое распределение и оценить связи, которые оно описывает, используя 100-
бальную ш калу субъективных оценок.
Мы ож идали, что точность оценок испытуемых в этом задании будет ч а­
стично зависеть от трудностей, с которыми они столкнулись при кодирова­
нии, оперировании и запоминании данных. Чтобы проверить это предполо­
ж ение, три типа стимульного материалов сильно различались в требовани­
ях к обработке информации, которые они предъявляли к испытуемым до
оценки ковариации, особенно учиты вая необходимость оценки величины
стимула и необходимость хранения и выборки информации из пам яти. Та­
ким образом, первы й тип представлял множества из 10 пар простых чисел.
Второй тип состоял из рисунков, каж ды й из которых изображ ал группы из
10 человек разного роста, держ ащ их трости разной длины. Заклю читель­
ный тип распределения был представлен в форме аудиокассет, на которых
можно было услы ш ать, к ак каж ды й из 10 человек сначала говорил некото­
рую букву, занимающую некоторую порядковую позицию в алфавите (по
сути, первую букву своей фамилии) и затем сразу ж е пел музы кальную ноту
разной продолжительности.
Субъктивная оценка ковариации... 251

Таблица 1. Пары переменных, описанные испытуемыми и их объективные


корреляции

Приведенные переменные Объективная


корреляция
Оценки студентами собственного либерализма
А Оценки студентами деятельности экономических -0.28“
лидеров в прошлом десятилетии
Оценки студентами собственной
В интеллектуальности
Оценки студентами деятельности американских -0.19“
президентов в прошлом десятилетии
Оценки студентами собственной застенчивости
С Количество американских штатов, которые -0.12“
посетили студенты
D Оценки студентами собственного честолюбия
Рост студентов 0.01“
Оценки студентами работы ректоров
Б университета в прошлом десятилетии 0.08ь
Время, потраченное студентами в неделю на
занятия спортом
Оценки студентами собственной
F интеллектуальности 0.17“
Семейный доход студентов
Нечестность детей, измерянная в соответствии с
ложным сообщением о спортивных достижениях
G Нечестность детей, измерянная в соответствии со 0.18“
степенью обмана, используемого при решении
загадки
Семейный доход студентов
Н Оценки студентами действий экономических 0.28“
лидеров в прошлом десятилетии
Способность шестиклассников "препятствовать
I вознаграждению"
Способность шестиклассников сопротивляться 0.31е
искушению обмануть
Оценки студентами собственной сознательности
J Оценки сознательности этих студентов, 0.35d
предоставленные их соседями по комнате
Оценки студентами собственной
К интеллектуальности 0.37“
Оценки студентами собственного честолюбия
Оценки студентами деятельности Конгресса в
L прошлом десятилетии
Оценки студентами деятельности трудовых 0.40“
лидеров в прошлом десятилетии
252 КОВАРИАЦИЯ И КОНТРОЛЬ
Продолжение табл. 1
Время, потраченное студентами в неделю на
занятия спортом
м Оценки студентами собственной физической 0.52*
формы
Оценки студентами деятельности американских
президентов в прошлом десятилетии
N Оценки студентами деятельности экономических 0.55*
лидеров в прошлом десятилетии
Оценки собственного политического
консерватизма
О Объединение оценок пунктов шкалы 0.57*
этноцентричности
Рост студентов
Р 0.79*
Вес студентов

•Корреляция, полученная из исследования студентов (N=295) Стэнфордского университе­


та.
ьКорреляция, полученная из работ Гартшорна и Мэя (Hartshorne & May, 1928).
'Корреляция, полученная из работ Мишеля и Гилигана (Mischei & Gilligan, 1964).
'‘Корреляция, полученная из работ Бема и Аллена (Bern & Allen, 1974).
'Корреляция, полученная из работ Адорно и др. (Adorno..., 1950).

Оценки ковариации, основанные на теории. Д ругая часть эксперимента


(порядок представления этих двух частей был сбалансирован) рассматри­
вала оценки ковариации, основанные скорее на априорных ож иданиях ис­
пытуемых или теориях, чем на непосредственно доступных двумерных дан­
ны х.
П ары измерений или переменных были определены, и испытуемых по­
просили оценить сначала направление, а затем силу связей для каж дой пары,
всегда используя ту ж е простую субъективную 100-бальную ш калу оцен­
к и , к ак было использовано для оценок, основанных на данных. Некоторые
из этих пар в этой части эксперимента касались расходящ ихся поведенчес­
к и х измерений личны х черт характера, например, два измерения честнос­
ти, используемые в классическом исследовании Гаршорна и М эя (H artshorne
& May 1928) кросс-ситуативной последовательности в моральном поведе­
нии; другие касались личны х отнош ений, привы чек или предпочтений. В
каж дом случае, однако, субъективны е оценки ковариации, которы е мы
получили, сравнивались с “объективными” корреляциям и, взяты ми из пре­
дыдущ их эмпирических исследований. (Полный список этих пар перемен­
ны х и соответствующ их корреляций представлен в табл. 1)
Субъктивная оценка ковариации... 253
Р е зу л ь т а т ы
О ценки ковариации, основанные на данны х
Н аш е первое исследование вклю чает оценки ковариации, которые испы ту­
емые сделали в ответ на непосредственно доступные двумерные данные.
Могут возникнуть два специфических вопроса: во-первых, к ак легко чело­
век может обнаружить ковариации различной величины при отсутствии лю­
бой “теории” о соответствующих распределениях данных? Во-вторых, к а ­
кова бы ла природа “психоф изической ф ункции”, связываю щ ей среднее
значение субъективны х оценок и объективное измерение ковариации?
П роверка данны х предполагала, что задача оценки была очень трудна.
Стандартные отклонения и м еж квартильны е ш ироты , связанны е с полны­
ми оценками группы для каж дого набора данны х были чрезвычайно высо­
ки (см. Рисунок 1). Что является особенно интересным - это трудность, с
которой столкнулись многие испытуемые, просто в признании существова­
н ия полож ительны х связей, даж е связей большой величины . Ф актически
только, когда объективные корреляции достигают уровня от + 0.6 до + 0.7,
м еж квартильны й интервал последовательно исклю чает отрицательны е
оценки связей. Нестабильность оценок ковариации систематически не от­
личалась для трех типов двумерных распределений данны х, несмотря на
явны е различия в количестве обработанной информации (и, следователь­
но, возможности для случайной или систематической ош ибки), связанной
с этими тремя типами. Эта очевидная нечувствительность к увеличению тре­
бований к процессу “обработки информации” может предлож ить реш ения
относительно природы оценочной “стратегии” испытуемых - возможность,
которую мы будем исследовать несколько позж е в этой главе.
Такж е на Рисунке 1 представлены данные, соответствующие второму воп­
росу об оценках, основанных на данны х, вопросу о “функциональной свя­
зи ” между объективными и субъективными показателями ковариации. (Ч и­
татель обратит внимание, что средние величины этих трех областей стиму­
ла объединены в этом представлении результатов. Ни проверка, ни статис­
тические тесты значимости не показали н икаких сущ ественных или после­
довательных тенденций, отличаю щ ие результаты для трех областей стиму­
ла, и результат такого объединения - более однородная и более понятная
ф ункция, чем ф ункция, полученная для любой из трех индивидуальных
областей.) Д ля удобства читателя мы подогнали кривую к пунктам в наш ем
граф ике. Мы долж ны отметить, что эта кри вая, была нарисована позднее;
она не была получена из какой-либо “психофизической теории”.
Из проверки ясно, что, несмотря на внутригрупповую изменчивость для
индивидуальны х оценок, ф ункция, связы ваю щ ая средние субъективные
оценки с объективными корреляциям и (корреляция Пирсона) была доволь­
но однородная. Существует резко возрастаю щ ая ф ункция, связываю щ ая эти
две переменные. Таким образом, связи в изменениях, с которыми обычно
254 КОВАРИАЦИЯ И КОНТРОЛЬ

Объективная корреляция

Рис 1. Средние величины и м еж квартильны е изменения для оценок


ковариации, основанных на данны х, причем результаты для трех ти­
пов р асп ред ел ен и я объ еди н ен ы . “П си х о ф и зи ч еск ая ф у н к ц и я ”
100(W l - г2) показана пунктирной линией
сталкиваю тся психологи, занимаю щ иеся измерениями черт характера лич­
ности или другой кросс-ситуативной устойчивости в социальном поведении
(то есть, г - от 0.2 до 0.4), можно обнаружить только, вы давая средние оцен­
ки в диапазоне от 4 до 8 на 100-бальной ш кале. Д аж е связи, рассматривае­
мые таким и психологами к ак очень прочные (то есть, г = от 0.6 до 0.8), за­
канчиваю тся довольно скромными субъективны ми оценками ковариации.
Объективные корреляции 0.7, например, произвели среднюю субъектив­
ную оценку 34 - оценка, находящ аяся между пунктами помеченными “до­
вольно слабая” и “умеренная” на субъективной 100-бальной ш кале. Толь­
ко, когда объективные корреляции приблизились к уровню 0.85, среднее
значение группы достигло средней точки субъективной ш калы , и только за
этой точкой испытуемые последовательно оценили связи к ак крайне поло­
ж ительны е.
Более близкое рассмотрение оценок предполагает, что субъективны е
оценки связанности или ковариации - не линейная ф ункция г или не г2.
Субъктивная оценка ковариации... 255
Скорее, образец объединенной средней оценки каж ется хорошо описанным
вы раж ением, (1- /1 - г2). (Читатель может узнать это вы раж ение как “коэф­
фициент отчуж дения”, меру редукции стандартной ош ибки, связанной с
прогнозированием переменной Y, основанным на знании к ак переменной
X , так и корреляции между X и Y (H untsberger, 1967)). Действительно, по­
добие между фактическими средними оценками и оценками, описанными
этим вы раж ением, было поразительно - 95% вариации между средними
объясняется функцией, основанной на коэффициенте отчуждения. Мы спе­
ш им напоминать читателям , однако, что они не должны неверно понять
значение этого точного соответствия. Степень соответствия, показанная на
Рисунке 1, прим еняется только к групповым оценкам; индивидуальные
оценки свидетельствовали о трудностях испытуемых в различении разны х
уровней ковариации.
Очевидно, преждевременно делать какой-либо вывод относительно при­
роды “психофизической” ф ункции, связываю щ ей субъективные ответы и
объективные измерения ковариации. Д етали задачи, контекст, и возмож­
но, даж е совокупность оцениваю щ их, несомненно, произвели бы различия
в ф ункции, различия, которые могли быть зафиксированы только путем
вклю чения соответствующих параметров. Однако, имеющ ихся результатов
достаточно, чтобы предположить, что умеренные корреляции подобного
вида, о которых так часто сообщают психологи-эксперты (cp. M ischei, 1968,
1969), вероятно, будут слабо обнаруж иваться или произведут только очень
слабое впечатление на обывателей, которые сталкиваю тся с таким и кова­
риациям и в отсутствии предубеждений, основанных на теории.
Далее стоит перенести внимание на то, что три различные задачи оценок
ковариации, основанных на данных, произвели очень похожие результаты,
несмотря на различные требования к обработке информации, которые они
предъявили испытуемым. Таким образом, “психофизическая” функция, про­
иллю стрированная на Рисунке 1, точно отражает связи между субъективны­
ми оценками и объективными измерениями для каждой из этих трех задач,
выполненных испытуемыми. К орреляция между средними значениями ф ак­
тических оценок испытуемых и оценками, спрогнозированными оценкой
функции от г = 0.91 для пары нота / буква до г = 0.98 для пары чисел.

О ценки, основанные на теориях


Ранее мы представили свидетельство того, что необходимо, чтобы относи­
тельно сильная объективная корреляция (г в терминах Пирсона) породила
субъективные оценки, даж е незначительно отличные от нуля. Рассмотрен­
н ая отдельно, психофизическая ф ункция для оценок, основанных на дан­
ны х, может просто быть свидетельством того, что субъективные измерения
обы вателя осторожны или консервативны по отношению к измерениям,
используемы м наиболее формальны ми статистикам и. (Конечно, трудно
поспорить, что г2 — более соответствующий индекс соотнесенности, чем г,
256 КОВАРИАЦИЯ И КОНТРОЛЬ
т. к. он мож ет быть легче связан с прогнозирующей полезностью или умень­
ш ением неопределенности относительно значения одной переменной, осно­
ванной на знании значения другой, связанной с ней, переменной.) Короче
говоря, полученные оценки, основанные на данных, не предполагают к а­
кой-либо систематической ошибки со стороны интуитивного психолога, хотя
изменчивость, связанная с такими оценками, не оставляет сомнения отно­
сительно трудностей и неопределенности в задачах оценки.
У читы вая эти результаты и возможные интерпретации, мы можем те­
перь перейти к рассмотрению результатов для субъективных оценок кова­
риации относительно связей, перечисленных в табл. 1. Эти оценки были сде­
ланы при отсутствии непосредственно доступных данных; предположитель­
но, они были осуществлены только на основе неофициальных теорий или
интуиции оценивающих, без сохранения этих “обработанных” данных, от­
меченных и извлеченных из ежедневного опыта. Рисунок 2 предоставляет
первое рассмотрение этих результатов. Ясно, что никакая отдельная линей­
н ая или какая-либо другая ф ункция не охватывает связи между субъектив­
ными оценками и объективными измерениями. Однако существует бесспор­
ная тенденция, согласно которой оценки испытуемых, основанные на теории,
показывают приблизительное соответствие объективным сведениям. То есть
положительные эмпирические связи были оценены к ак положительные; от­
рицательные связи были оценены как отрицательные; относительно прочные
эмпирические связи были оценены как более прочные, чем относительно не­
прочные, и т.д.

Рис. 2. Средние значения для оценок ковариации, основанных на тео­


рии. (См. обозначение переменных в табл. 1)
Субъктивная оценка ковариации... 257
Возможно, наиболее поразительная особенность оценок, основанных на те­
ории, - это то, что однажды освобожденные от ограничений, наложенных
непосредственно доступными данными, испытуемые переставали быть ос­
торожными или консервативными. Они охотно отмечали середину и даже
верхние области субъективной 100-бальной ш калы даж е, когда сталкива­
лись с парами переменных, которые объективно были незначительно кор-
релированы. Иллю страция, приведенная на Рисунке 2, убеждает в этом. Не­
сколько пар переменных, коррелированых на уровнях, которые в случае
оценок, основанных на данных, выдали средние субъективные оценки, весь­
ма близкие к 0 (например, г = 0.3), теперь выдали оценки 30, 40 или более
на субъективной 100-бальной ш кале.
Пары переменных G и I заслуж иваю т особенного вним ания, так к ак они
касаю тся основанных на теории оценок кросс-ситуативной поведенческой
устойчивости и, таким образом, вы раж аю т проблему, представляющую те­
оретический интерес в настоящ ее время (см. A lker, 1972; A llport, 1966; Bern
и A llen, 1974; Bern и Funder, 1978; Bern и Lord, 1979; M ischei, 1968,1969).
То, о чем говорят субъективные оценки для этих двух связей, очевидно. При
наличии непосредственно доступных объективных данны х, представляю ­
щ их корреляции в диапазоне от г = 0.2 до г = 0.3, испытуемые дали средние
оценки между 0 и 10 в оценочной 100-бальной ш кале. Теперь, при отсут­
ствии непосредственно доступных данны х, но касаю щ ихся двумерной об­
ласти, показываю щ ей тот ж е диапазон отг= 0.2 д ог = 0.3, подразумеваемые
теории индивидуальности подтолкнули испытуемых к тому, чтобы предло­
ж ить оценки ковариации, которые в среднем находились в диапазоне от 50
до 60. К акая степень ковариации в непосредственно доступных двумерных
данных потребовалась бы, чтобы породить подобные оценки при отсутствии
“теорий” или предубеждений? Ответ виден на Рисунке 2; только эмпири­
ческие корреляции в диапазоне г = 0.90, могли породить такие оценки.
Результаты наш его исследования, таким образом, наш ли отражение в
эмпирических обобщениях.
1. Когда непосредственно доступные двумерные данные исследованы при отсутствии
каких-либо теорий или предубеждений относительно их связанности, интуитивному
психологу труднее обнаружить ковариации величин, которые могут характеризовать
широкий диапазон функциональных связей, представленных в ежедневном социаль­
ном опыте. В частности, ковариации в диапазоне величин, с которыми обычно имеют
дело психометристы в поиске кросс-ситуативной поведенческой устойчивости, вероят­
но, останутся необнаруженными или будут восприняты как близкие к нулю.
2. Когда объективные доступные в настоящий момент двумерные данные не могут быть
исследованы, а предшествующие теории, или предубеждения существуют, интуитив­
ный психолог может ожидать и прогнозировать ковариации значительной величины -
часто большие, чем те, которые представлены прошлым опытом или будут представле­
ны в будущем.

Рассматриваемые вместе, эти обобщения помогают сосредоточить вним а­


ние на контрасте между оценками, основанными на данных и оценках, ос­
258 КОВАРИАЦИЯ И КОНТРОЛЬ
нованны х на теориях. Теории, сторонниками которых мы являем ся, зас­
тавляю т нас ож идать и прогнозировать более прочные эмпирические связи,
чем они есть на самом деле; и многие существующие эмпирические связи,
даж е большой величины, могут быть обнаружены, только если мы уже ож и­
даем это сделать.

П р о и сх о ж д ен и е и ж и зн есп о со б н о сть тео р и й


Стратегии оценки ковариации
Кроме предлож ения обобщений относительно исходов различны х заданий
оценки, важ но начать рассматривать процессы оценки и стратегии, кото­
рые могли бы леж ать в основе таких исходов. Снова различие между оцен­
кам и, основанными на данных и теориях, оказы ваю тся критическими, и
снова конструктивны е выводы Чепманов обеспечивают удобный отправной
пункт.
Данные вместо теории. И з исследований Чепманов стало ясно, что преду­
беждение одержало победу над информацией, предоставленной непосред­
ственно доступными данными. Менее очевидно, однако, к ак это происхо­
дит. “Видели” ли испытуемые на самом деле те связи, о которы х они сооб­
щ али? И ли они просто сообщали об отнош ениях, которые, как они ож ида­
ли , будут присутствовать в данны х, без какого-либо соответствую щ его
субъективного впечатления? И ли испытуемые “ш ли на компромисс” м еж ­
ду своим субъективными восприятием и ож иданиями, придавая некоторое
значение каж дом у из них? Невозможно дать однозначный ответ на основе
сообщенных результатов, хотя имеется определенное свидетельство, как
того, что испытуемые, придавали, по крайней мере, некоторое значение сво­
ему непосредственному восприятию данных и что их восприятие полнос­
тью не было определено их ож иданиями. В частности, мы обращаем внима­
ние н а сообщение Чепманов, что повторное воздействие не-отношений (non­
relationships) в конечном счете, уменьш ало количество сообщений об иллю ­
зорной корреляции. Однако было такж е ясно, что данные никогда не могли
полностью одерж ать победу над предубеждениями испытуемых, так к ак
даж е при увеличении числа раз, когда испытуемые подвергались воздей­
ствию отрицательных связей, не могло полностью устранить сообщения
об иллю зорны х положительных корреляциях.
Вопросы об интуитивны х стратегиях для оценки ковариации, таким об­
разом, оказы ваю тся в центре вним ания. К ак испытуемые решают, какая
степень связи присутствует в данны х? К ак они решают, к акая степень свя­
зи “долж на”, присутствовать в репрезентативном наборе двумерных наблю­
дений, которы е предоставлены в соответствии с их интуитивными теория­
ми или предубеждениями? Когда и как предубеждения преобразовывают
субъективны е опыты ковариации? Н ачиная разм ы ш лять над ответами на
Субъктивная оценка ковариации... 259
такие вопросы еще раз полезно вначале сосредоточиться на оценках, осно­
ванны х только на данны х и оценках, основанных только (или, по крайней
мере, в значительной степени) на теории, и только затем вернуться к слу­
чаю , когда сталкиваю тся непосредственно доступные данные и ожидания,
основанные на теории.
Стратегии оценок, основанных на данных. Возможно, наш е наиболее по­
разительное откры тие относительно оценок, основанных на данны х, вклю ­
чало ответы испытуемых на двумерные распределения, предлагающ ие ко­
вариации величин, которые встречаю тся в каждодневном опыте и соответ­
ствуют неофициальным социальным теориям, в частности, для испытуе­
мы х трудно обнаружить такие связи. И, в среднем, они оценили ковариа­
ции, к ак весьма близкие к нулю. К акие последствия имеют такие результа­
ты на неофициальные стратегии оценки ковариации, которые могли бы ис­
пользоваться наш ими испытуемыми?
Разм ы ш ляя над этой проблемой, важ но помнить, что отдельные испыту­
емые не считали, что объективно слабые корреляции были близки к нолю.
Вместо этого, они предлож или довольно ш ирокий диапазон оценок, для
которы х только соответствующие средние значения были близки к нулевой
отметке. Снова, трудно точно различить, что испытуемые ф актически “ви­
дели” и что они оценили, несмотря на то, что они видели. Поразительно од­
нородная и последовательная “психометрическая” ф ункция, связываю щ ая
средние оценки с ф актическими корреляциям и, не оставляет сомнения, что
испытуемые использовали характеристики данных, которые были после­
довательно связаны с объективной корреляцией. Величина изменчивости в
их оценках, однако, указы вает, что используемые характеристики данных
были только приблизительно связаны с объективными измерениями кова­
риации.
Мы подозреваем, и самоанализы некоторы х неопытных испытуемых,
которые вы полняли это задание, подтверждают это, что впечатления испы ­
туемых о “связанности” не отраж аю т попы тки рассмотреть полную выбор­
ку соответствующ их двумерных наблюдений. Скорее, испытуемые могут
полагаться на несколько специальны х, возможно, экстремальны х случаев
переменной X или переменной Y. Таким образом, они могут просто наблю­
дать направление и экстремальность величины Y, связанной с экстремаль­
ностью величины X, и наоборот. Ф акторы , влияю щ ие на внимание и па­
м ять, могли бы такж е иметь значение; таким образом, наглядность и конк­
ретность, так ж е к ак новизна представления, могли бы влиять на то, на к а ­
кие моменты данны х полагаю тся.
Уверенность в ограниченном количестве специальны х или “тестовых”
случаев, в частности, уверенность в крайних множествах, произвела бы по­
следствия, сопоставимые с наш ими результатами: во-первых, манипуля­
ции со стимулами (то есть, числа - рисунков - аудиозаписи), которые были
спланированы, чтобы изменять потребность в оценке величины и заломи-
260 КОВАРИАЦИЯ И КОНТРОЛЬ
н аяи я до оценки ковариации, должны были оказать мало воздействия, так
к ак эти дополнительные требования были восприняты тривиальны ми, если
испытуемые просто полагались на очень ограниченное число отдельных слу­
чаев. Во-вторых, в зависимости от того, какие отдельные случаи они прини­
мали во внимание, испытуемые, сталкиваю щ иеся с непрочными связям и,
к а к ож идалось, могли оценить их, скорее, к ак умеренно положительные
или к ак умеренно отрицательные, чем к ак равные нулю. Наоборот, испы ­
туемые, сталкиваю щ иеся с прочными связям и, могли бы показать вполне
последовательные и крайние оценки, так к ак положительные связи допус­
каю т мало вариативности в значениях одной переменной, которая может
быть связана с крайним значением другой переменной. Ф орма наш ей пси­
хометрической ф ункции, а такж е сокращ енная вариативность, связанная
с оценками самой прочной эмпирической связи, совместимы с теоретичес­
ки допущ енными последствиями того, что люди полагаю тся на экстремаль­
ные случаи, хотя такие сведения не убедительны. Ясно, что более опреде­
ленны е ответы могут быть получены только из исследовательских проек­
тов, в которы х значением экстремальны х (или непропорционально доступ­
ны х) случаев сознательно манипулировали.
Стратегия оценок, основанных на теории. Когда мы переклю чаем наш е
внимание на оценки, основанные на теории, вопрос, который сразу ж е воз­
никает - это насколько данные могут быть использованы в добавление к
чистой теории. В некоторых случаях, вероятно, что ни к каким данным не
будут обращ аться. Испытуемые, например, могли полагаться только на
интуицию , основанную на теориях или семантике, и ож иданиях; то есть
прим еняли критерий репрезентативности (cp. Kahnem am и Tversky, 1973,
4), рассматривая связи между двумя переменными в каж дой паре. Мало кто
из читателей будет оспаривать утверждение, что люди придерживаю тся со­
циальны х теорий подобного происхождения (или, по крайней мере, могут
без труда создать). И действительно, любой обыватель может создать новые
теории или дать прогнозы о ф ункциональны х связях слиш ком быстро, что­
бы такие теории зависели от создания и анализа ф актических случаев.
Однако мы не подвергаем сомнению возможность, что некоторые оценки
ковариации, основанные на теории, подразумевают обращение к фактичес­
ким сведениям. Опять ж е, однако, мы подозреваем, что обыватель, более ве­
роятно, будет полагаться на специфические тестовые случаи, подверженные
многочисленным предубеждениям в кодировании, хранении и вспоминании,
чем производить и неформально анализировать некоторую полную выборку
двумерных данных.
Н екоторые теории или убеждения относительно специфических связей
могут, таким образом, частично основываться н а данны х. Другие могут ос­
новы ваться на выводах из более обш ирных убеждений о мире, народной
мудрости, семантических ассоциациях или убедительности общ ения с се­
мьей, друзьям и или информации, полученной из средств массовой инфор­
Субъктивная оценка ковариации... 261
мации. Независимо от их происхождения, однако, ясно, что многие убеж­
дения являю тся как ошибочными, так и способными закрепляться и, воз­
можно, даж е усиливаться, несмотря на сведения, которые вызвали бы се­
рьезные сомнения у любого непредубежденного наблюдателя. Конечно, у
любого непредубежденного наблю дателя, у которого был бы калькулятор,
вводный текст по статистике, и некоторые обычные знания относительно
того, к ак их использовать. Поэтому мы закончим эту главу, кратко задав
пару близких вопросов о столкновении между интуитивными теориями и
ежедневным опытом с эмпирическими ковариациям и, которые “проверя­
ю т” эти теории: во-первых, каковы механизмы , с помощью которых ош и­
бочные или высоко преувеличенные убеждения относительно функциональ­
ны х связей могут закрепляться, несмотря на убедительные логические оп­
роверж ения? Во-вторых, как может наш е описание недостатков обывателя
быть приведено в соответствие с очевидной способностью организмов к обуче­
нию (в частности, инструментальное обусловливание и реакционное обуслов­
ливание и с очевидной точностью и адекватностью многих наш их каж дод­
невных убеждений и социальных стратегий?)
Этих вопросов можно касаться только здесь, и мы отсылаем заинтересо­
ванного читателя к более всесторонним обсуждениям в Главе 9 этого изда­
н ия и в других публикациях (например, N isbett и Ross, 1980).

М еханизм ы устойчивости теории


Теории об эмпирических связях, таких к ак впечатления об отдельных лю­
дях, часто показываю т удивительную способность сохраняться сталкива­
ясь с эмпирическим опровержением. Одно из множеств механизмов, кото­
рые объясняю т такую устойчивость, происходит из простого ф акта, что люди
обычно действуют в соответствии со своими убеж дениями; эти действия
могут варьироваться от простой общественной защ иты до влож ения време­
ни, энергии, богатства или репутации. Такое поведенческое обязательство
меш ает субъекту усоверш енствовать свои убеждения в свете новых сведе­
ний (Abelson и другие, 1968; F estinger, 1957, 1964). Действительно, убеж­
дения или ож идания человека могут превратиться в самосбывающиеся пред­
сказани я, посредством чего первоначально необоснованные убеждения зас­
тавляю т его вести себя так, чтобы произвести исходы или данные, которые
полностью подтверждают его убеж дения (M erton, 1948; R osenhan, 1973;
R o sen th al & Jaco b sen , 1968; S nyder & Sw ann, 1976; S nyder, T anke, &
B erscheid, 1977).
Недавнее исследование, проведенное Леппером, Россом и их коллегами,
проиллю стрировало дополнительные механизмы или процессы, которые
могут леж ать в основе устойчивости убеждений. Эти механизмы включают
наклонности “наивного” ученого к ак к ассимиляции недавно рассмотрен­
ного отрезка информации к ак ф ункции их соответствия с предшествующи­
ми убеждениями, так и к выходу за пределы ассимиляции данных к разра­
262 КОВАРИАЦИЯ И КОНТРОЛЬ
ботке причинных объяснений того, почему предполагаемое состояние сохра­
няется (см. Главу 9 этого издания A nderson, Lepper, & Ross, 1980; Jennings,
Lepper, & Ross, 1980; Lord, Ross, & Lepper, 1979; N isbett & Ross, 1980; Ross,
1977; Ross, Lepper, & H ubbard, 1975; Ross, Lepper, Strack & Steinm etz, 1977).

В ы явление ковариации, обусловливание и другие успехи реальной


ж изни
Н аш е нелестное описание способностей обывателей вы являть и оценивать
ковариацию , мож ет с первого взгляда показаться несоответствующим ог­
ромному количеству лабораторных сведений и даж е ещ е более обширной
базе ежедневного опыта, иллюстрирующего классическое и инструменталь­
ное обусловливание. К аж дая кры са, которая научилась убегать из мыш е­
ловки, каж ды й ребенок, который оценил преимущество добавления сахара
в каш у, каж ды й возлюбленный, который понял, что честность - не всегда
хорош ая политика, каж дая мать, у которой на плач ее ребенка возникал
рефлекс кормления грудью, является доказательством того, что организмы
действительно распознаю т ковариации среди стимулов окружаю щ ей сре­
ды. И разве работа Чепманов, а такж е наш и работы, касаю тся некоторого
очень узкого и сокращ енного класса задач оценки ковариации, сталкива­
ясь с которыми, обыватель проявляет однозначные недостатки? Нисбетт и
Росс (N isbett & Ross, 1980) обсудили эту проблему и приш ли к выводу, что
ответ н а этот вопрос отрицателен. Они заявляю т вместо этого, что именно
явления обусловливания, являю тся “исклю чением”, и именно ограничен­
н ая возможность вы явить и оценить ковариацию , описанная в этой главе,
иллю стрирует “правило”.
Мы не можем подробно рассмотреть соответствующие аргументы, но сущ ­
ность исследования Нисбетта и Росса в том, что классическое и инструмен­
тальное обусловливание получено при строго ограниченны х обстоятель­
ствах, вклю чаю щ их значимость и выраженность стимула, оптимальный ин­
тервал между стимулами и моментами применения стимула, или отсутстви­
ем события, несоответствующего стимулу или рассеивающего стимул. Два
дополнительных ф актора, которые они упоминают, заслуживаю т особого
вним ания. Во-первых, стоит отметить, что в то время к ак обусловливание
мож ет сохраняться с относительно низкой ковариацией между обусловлен­
ным стимулом (ОС) и необусловленным стимулом (НОС) или реакцией и
закреплением , оно почти неизбежно может быть получено при условии иде­
альной ковариации, то есть, за ОС или за реакцией неизбежно следует НОС
или закрепление, и последнее никогда не наблюдается в отсутствие перво­
го. А симметрия между необходимыми условиями для приобретения обус­
ловленной реакции и сохранением или “устойчивостью” такой реакции,
таким образом, иллю стрирует, в некоторой степени, такую ж е асимметрию
между оценкой ковариации, основанной на данны х, и оценкой, основанной
на теории, которая исследовалась в данной главе. То есть во время поддер­
Субъктивная оценка ковариации... 263
ж ан и я состояния организм может продолжать ож идать, и возможно, даж е
чувствовать большую ковариацию между ОС и НОС или между реакцией и
закреплением , чем объективно оправдано. О рганизм мож ет приним ать
закрепленны й опыт в номинальной стоимости при приписывании не-зак-
репленного опыта к изменению обстоятельств, влиянию третьих перемен­
ны х или даж е случая.
Возможно, самым важ ны м является веское свидетельство, что как инст­
рументальное, так и классическое обусловливание выигрывает от (а в неко­
торых случаях даж е требует) хорошего соответствия между случайностя­
м и, которые необходимо изучить, и предшествующими теориями или ож и­
даниям и, с которыми организм попадает в лабораторию. По крайней мере,
ясно, что не все случаи ОС-НОС или реакция-закрепление одинаково усваи­
ваю тся. Возможно, наиболее внуш ительные доказательства этого обеспечил
Гарсиа и его коллеги (например, G arcia, McGowan и G reene, 1972). Эти ис­
следователи сообщили, что кры сы могут научиться на единственном испы­
тании, избегать пробовать пищ у, которая вы зывает желудочно-киш ечное
расстройство, даж е если интервал между едой и расстройством - целы х 12
часов. И , напротив, у ж ивотного, которое заболевает через несколько часов
после потребления пищ и со знакомым вкусом, но новой формы, не наблю­
дается подобной обучаемости. С другой стороны, когда немедленная боль
заменяет отсроченную болезнь к ак НОС, получается противоположный ре­
зультат; то есть кры са с готовностью у чится избегать новых форм, а не но­
вы х вкусов, когда такие стимулы немедленно сопровождаются ударом то­
ком. К ак заклю чаю т Нисбетт и Росс (N isbett & Ross, 1980), кры са может
характеризоваться к ак обладаю щ ая двумя “теориями”, обе из которых хо­
рошо подходят для ф актических непредвиденных обстоятельств ее эколо­
гии: (а) отличительные вкусовые сигналы , которые сопровождаются более
поздним (даж е намного более поздним) расстройством, долж ны рассматри­
ваться к ак подозрительные; (Ь) отличительные осязательны е или простран­
ственные сигналы , которые сопровождаются немедленной телесной болью,
долж ны рассматриваться к ак подозрительные.
Таким образом, в более общих терминах (ср. Testa, 1974), организмы, как
люди, так и кры сы , будут видеть те и только те ковариации, которые их соб­
ственная история или история их вида предполагает видеть. Если не руко­
водствоваться “теориями”, обнаружить ковариации становится очень труд­
но и вероятно, это произойдет только тогда, когда соответствующие корреля­
ции приближаю тся к единице, и /и ли когда условия для обучения оптималь­
ны в терминах самих факторов, которые были объяснены в лабораториях с
помощью длинной и выдающейся линии между Хола и Скиннера.
Иногда, конечно, каждодневные обстоятельства являются оптимальны­
ми для обучения. Таким образом, в наш ем каждодневном опыте мы изучаем,
что делают бесчисленные выклю чатели, рычаги, кнопки и другие механиз­
мы управления, и что обозначает изумительное разнообразие знаков, симво­
лов и сигналов, потому что соответствующие ковариации так близки к совер­
ш енным. Одинаково важным является ф акт, что обыватель, подобно учено­
му, часто мож ет “проверять” новые гипотезы, которые он принимает во вни­
мание. Могут преднамеренно быть созданы выборочные данные, которые го­
раздо лучш е подходят для данной логической задачи, чем выборки, предло­
ж енные случайным опытом и воспоминанием.
Действительно, наш е влияние на окружающ ую среду все более и более
зависело от наш ей способности заменять относительно формальные инст­
рументы для заклю чений на неформальные. Наш успех отраж ает наследие
поколений обычных м уж чин и ж енщ ин, которые тщ ательно отметили и
записали результаты и , ещ е раньш е, от поколений бесчисленных учены х,
достигш их мастерства в искусстве формального экспериментирования и
статистического анализа.
16. Иллюзия контроля*

Эллен Й. Лангер

В то время к ак большинство людей согласится, что имеется много точек со­


прикосновения между навыком и удачей, все ж е необходимо достичь полно­
го понимания того, насколько неразрывно связаны эти два понятия. В прин­
ципе, различие каж ется ясным. В ситуациях навы ка имеется причинная
связь между поведением и исходом. Таким образом, успех в задачах навы ка
управляется. Удача, с другой стороны, является случайным событием. Ус­
пех в действиях удачи или случая, очевидно, не поддается контролю. Инте­
ресующая нас проблема - действительно ли это различие признается. Пред­
положение, принятое здесь - то, что нет. В то время как люди признают кон­
цепцию случая, они ведут себя, как если бы случайными событиями можно
было управлять. Если это правильно, интересно определить переменные, от­
ветственные за эту путаницу....
Н екоторые наблюдения говорящ ие в пользу утверж дения, что люди об­
ращ аю тся со случайными событиями как с управляемы ми, идут от социо­
логов Гофмана (G offm an, 1967) и Х энслина (H enslin, 1967). При изучении
методов игры в казино в Лас-Вегасе, Гоффман отметил, что работники кази ­
но, раздаю щ ие карты , в периоды возникновения неудач, подвергались рис­
ку потери своих рабочих мест. Х энслин изучил игру в кости и отметил, что
игроки в кости явно ведут себя так, как-будто они управляю т исходом брос­
ка. Они осторожно бросают кости, если они хотят вы падения низкого числа
или бросают их резко для вы соких чисел. Они полагаю т, что усилия и кон­
центрация окупятся. Контроль можно такж е наблюдать и при заклю чении
пари; например, всегда держите пари с человеком, который вы глядит так,
как-будто у него все под контролем. Это поведение весьма рационально, если
человек полагает, что игра требует навы ка.

* Выдержки из книги, которая появилась в журнале “Journal of Personality and Social


Psychology”, 1975,32,311-328. Авторское право© 1975 принадлежит Американской Пси­
хологической Ассоциации. Переиздано в соответствии с разрешением
266 КОВАРИАЦИЯ И КОНТРОЛЬ
Если бы человек попробовал проявить контроль над случайным событи­
ем, можно было бы оказать влияние прежде, чем исход случая определен.
С трикленд, Л евики и Кац (S trickland, Lewicki, K atz 1966) проверили это
предположение. Испытуемые были привлечены в игру в кости, в которой
они вы бирали одно из множества альтернативны х пари либо до того, к ак
кости были брошены, либо только после броска, но прежде, чем исход объяв­
лен. Они обнаруж или, что испытуемые ш ли на больший риск, то есть дела­
ли больш ие ставки, когда держ али пари перед броском, чем после броска.
Предыдущ ее исследование показы вает, что люди часто не могут реаги­
ровать по-разному на управляемы е и не поддающиеся контролю события.
Однако, ф акторы , которые управляю т этим иллю зорным процессом конт­
роля, систематически не изучались. Один способ идентифицировать эти ф ак­
торы состоит в том, чтобы исследовать характеристики ситуаций навы ка. В
ситуациях навы ка люди участвуют в различном открытом и тайном пове­
дении, результатом которого является увеличение вероятности успеха: вы ­
бор того, к аки е материалы являю тся соответствующими ситуации и каки е
реакции проявлять, ознакомление с этими материалами и реакциям и, тра­
та времени на обдумывание задачи для достиж ения возможных стратегий,
которы е могут использоваться, и трата усилий, будучи активно заняты м и в
задаче, чтобы увеличить ш анс успеха. Кроме того, ситуации навы ка имеют
некоторые характеристики, не обязательно вызванные человеком, чтобы
максимизировать вероятность успеха. К онкуренция - один из таких ф ак­
торов.
Эти связанны е с навыком факторы могут отвечать за появление иллю зии
контроля. И ллю зия контроля определена к ак ожидание, что личная вероят­
ность успеха будет выше, чем гарантировала бы объективная вероятность.
Следующие исследования были предназначены для оценки эффективности
этих относящихся к навыкам факторов в создании иллюзии контроля. В част­
ности, исследование, которое будет описано, было предназначено, чтобы про­
верить следующую гипотезу: поощ ряя или позволяя участникам случайного
события вести себя так, как они себя вели, если бы участвовали в ситуации,
требующей навы ка, увеличиваем ли мы вероятность появления ориентации
навы ка; то есть стимулируем ли мы иллюзию контроля. Таким образом, нуж ­
но уметь ввести любой из выше упомянутых аспектов ситуации навы ка,
выбор, стимул или обычностьреакции, пассивное или активное вмешатель­
ство, конкуренция, - в ситуацию, определяемую случаем, где участники боль­
ш е не влияю т на исход и случайное поведение, более соответствующие собы­
тию, требующему навы ка.
Серьезное испы тание этой гипотезы - внедрение этих факторов в ситуа­
ции такие, к ак лотереи, где исходы полностью определены случаем. Если
эти ф акторы успешно стимулирую т иллю зию контроля в этих механичес­
ких ситуациях, то их влияние должно быть гораздо большим, когда они пред­
ставлены в ситуации, где уж е имеется элемент контроля....
Иллюзия контроля 267
Э к сп ер и м ен т 1: В л и ян и е к о н к у р ен ц и и н а и л л ю зи ю к о н тр о л я
Так к ак люди часто вовлекаю тся в конкуренцию , когда они оценивают свои
навы ки, вероятно, что введение этого связанного с навыком фактора в ситу­
ации случая стимулирует иллюзию контроля. Количество контроля, кото­
рое человек фактически проявляет в создании успешного исхода в квали­
фицированном соревновании, изменяется к ак ф ункция способности против­
ника. Если люди реагируют на случайные события, в которых имеется кон­
куренция, к ак будто эти события были определены навыком, тогда иллю ­
зи я контроля долж на такж е измениться к ак ф ункция характеристик про­
тивника.
В следующем исследовании испытуемые конкурирую т в случайной за­
даче против либо привлекательного, самоуверенного человека или неуклю ­
ж его и нервного человека. Если на задачу реагирую т, к ак будто исходы не
поддается контролю , то факторы , отличные от вероятности победы, играют
большую роль во влиянии на ставки испытуемых. При таких обстоятель­
ствах испытуемые, ставят на кон много при конкуренции против уверенно­
го человека либо потому что он, к ак ож идается, поставит много, и испытуе­
мые хотят казаться подобными ему, либо потому что риск ценится в нашем
обществе (W allach и W ing, 1968). Испытуемые могут такж е поставить мно­
го при игре против неуклю жего человека, чтобы казаться отличным от него
или, опять ж е, потому что риск ценится. Однако они могут такж е поставить
меньш е, держ а пари против неуклю ж его человека, потому что он, к ак ож и­
дается, поставит меньш е, и таким образом, испытуемые, рискую т меньше,
но все еще считаю тся азартны ми. В любом случае, испытуемые не должны
ставить больше против неуклю жего человека, чем против уверенного в себе
противника. С другой стороны, если, к ак было спрогнозировано, конкурен­
ц и я стимулирует ориентацию навы ка, то испытуемые будут держ ать пари
на основе вероятности победы. Чем менее компетентен противник, тем бо­
лее вероятно, что человек победит, следовательно, испытуемые должны ста­
вить больше при конкуренции против неуклю жего человека, чем при кон­
куренции против уверенного в себе человека.

М ет од

Испытуемые: 36 студентов старших курсов мужского пола, зарегистрированных на


вводном курсе психологии в Йельском университете. Они были привлечены через рек­
ламное объявление, которое предлагало зачет и шанс выиграть деньги за участие в ис­
следовании, посвященном связям между когнитивными и физиологическими реакци­
ями. Они были наугад распределены в одну из двух экспериментальных групп по 18
испытуемых в каждой.

Процедура. Когда испытуемый входил в комнату, в которой должен был проходить


эксперимент, он находил ожидающего его противника, который был другим испытуе­
мым. Противник, студент-старшекурсник мужского пола, не знающий об эксперимен­
268 КОВАРИАЦИЯ И КОНТРОЛЬ
тальной гипотезе, играл роль либо уверенного, либо неуверенного в себе человека (изоб­
ражающий щеголя или растяпу).
Условие - противник щеголь. При этом условии противник был уверенным и общи­
тельным человеком, одетым в хорошо сидящую спортивную куртку. Он представлялся
испытуемому и указал на записку, находящуюся в комнате. В записке говорилось, что
экспериментатор скоро вернется, а также, чтобы испытуемые заполнили за это время
краткую анкету. Чтобы показалось, что исследование касается психологических воп­
росов, в анкетном опросе спрашивалось относительно диеты, болезней в семье и т.п.
Испытуемый и противник заполняли анкеты и общались в течение приблизительно 10
минут. Беседа была логически структурирована, но сосредоточена, главным образом,
на спортивных событиях. После этого взаимодействия противник беспечно стучал в сте­
ну, которая отделила его и испытуемого от экспериментатора, чтоб дать знак возвра­
щаться в комнату.
Условие - противник растяпа . При этом условии противник был довольно застен­
чивым, вел себя неловко, нервно подергивался, и был одет в спортивное пальто, кото­
рое было слишком мало для него. Во всех остальных отношениях события были иден­
тичны условию противник-щеголь.
В обоих условиях противник снимал пальто прежде, чем экспериментатор входила
в комнату. После того, как были принесены извинения за опоздание, экспериментатор
просила испытуемых сесть и не разговаривать, в то время как она подготавливала ма­
териалы для исследования. Используя эти меры, было возможно заставить экспери­
ментатора не принимать во внимание предшествующую экспериментальную манипу­
ляцию. Испытуемый и противник сидели за столом, лицом друг к другу. После того,
как экспериментатор положила на стол датчик напряжения, спирт, марлевые губки,
электроды, электродный гель и ленту, она дала следующие инструкции:
Мы интересуемся влияниями некоторых моторных и когнитивных реакций на
психологические реакции. В частности, мы интересуемся изменениями сопро­
тивления кожи как функцией напряженных и не напряженных задач. Исследо­
вание было разработано так, чтобы Вы получили от него удовольствие, в то вре­
мя как я получаю информацию, в которой нуждаюсь. У вас будет возможность,
либо выигрывать, либо проиграть деньги, это должно быть весело, но нет ника­
кой гарантии, что вы выйдете отсюда, получив дополнительные деньги. Хоро­
шо, теперь первое, что я попрошу вас сделать, это чтобы вы примотали лентой
электроды к вашим рукам. Я хочу поместить ее на руку, которой вы не пишете.
Вы правша или левша? Не волнуйтесь, это не причинит вреда. (Экспериментатор
приматывает лентой электроды, включает в розетку датчик, и приносит колоду
игральных карт.)
Первое задание - игра в карты. Правила таковы: вы будете выбирать карту из
колоды, и кто выберет более высокую, тот побеждает в этом раунде. Будет 4 ра­
унда, и перед каждым вы запишете, сколько вы ставите на кон. Вы можете ста­
вить где-то от 0 до 25 центов в каждом раунде. Вы покажете ваши ставки мне, но
не друг другу. Не смотрите на карту, которую вы выбираете. Таким образом, ваши
ставки и исходы не будут влиять на ваши психологические реакции в следую­
щей задаче. Позже я переверну карты и подсчитаю, сколько было выиграно или
проиграно, с каждым из Вас индивидуально. Пари заключается только между
одним из вас и мной непосредственно, так что если Вы побеждаете, я плачу вам,
а если Вы проигрываете, вы платите мне либо в деньгах, либо временем. Вы хо­
тите участвовать? (Противник быстро отвечает “конечно!”) Хорошо, теперь, мы
можем начинать. Не записывайте, сколько вы поставили на кон, пока я не ска­
жу, чтобы я могла прочитать базовую линию на аппаратуре.
Экспериментатор тогда попросила испытуемых записать ставки и показать их ей.
Иллюзия контроля 269
Ставки были записаны, и затем испытуемые, поочередно тянули карту и, по просьбе
экспериментатора, одновременно показывали их ей, она записывала исход и затем клала
карты рубашкой вверх на ближайший стол. Перед каждым шагом экспериментатор
делала запись колебаний сопротивления кожи. Процедура повторялась для четырех
попыток.

Зависимые измерения и проверка манипуляции. В качестве зависимого измерения вы­


ступало количество денег, которые испытуемые ставили на кон в каждом раунде.
После того, как игра в карты была закончена, испытуемым сказали, что следующая
задача будет проведена индивидуально, поэтому одному из испытуемых необходимо
пройти в другую комнату, где другой экспериментатор даст ему инструкции. Им также
сказали, что как только этот эксперимент закончится, этот экспериментатор сообщит
другому экспериментатору об исходе карточной игры так, чтобы долги могли быть ула­
жены. Экспериментатор просил противника уйти и попрощаться с испытуемым, так
как их объединенное участие было закончено. Каждому испытуемому тогда дали видо­
измененную задачу так, чтобы он выиграл приблизительно $2, независимо от его пре­
дыдущих ставок. Испытуемый исследовал сосуд с бобами и оценивал их количество, в
то время как экспериментатор регистрировал колебания сопротивления кожи. Тогда
испытуемому предлагали другую анкету, которая была психологической по характе­
ру. После того, как его спросили, имело ли присутствие другого испытуемого какое-
либо влияние на его психологические реакции, его попросили оценить другого испыту­
емого по шестибальной шкале в пределах от 1 (не очень компетентный в межличност­
ном взаимодействии) к 6 (очень компетентного в межличностном взаимодействии). Ос­
тавшиеся вопросы были пунктами-наполнителями, которые имели отношение к пси­
хологическим вопросам. После того, как эти измерения были получены, всех испытуе­
мых поблагодарили и попросили позвонить автору в следующем месяце, если они хоте­
ли узнать цель и результаты исследования.

Р езульт ат ы
Перед исследованием, действительно ли количество поставленных на кон
денег варьировалось к ак ф ункция компетентности противника, важ но удо­
стовериться, что противник был действительно воспринят по-разному в двух
условиях. Средняя оценка компетентности противника была 4.8, при усло­
вии противник-щ еголь, и 3.17 при условии растяпа. П рактически не было
пересечений меж ду двумя условиями. Различие меж ду двумя средними
значениями значительно (t = 5.46, р < 0.005). Поэтому, можно сказать, что
испытуемые при условии противник-щ еголь видели себя конкурирую щ и­
ми против более компетентного человека, чем испытуемые в условии растя­
па.
Давайте вспомним, что испытуемые могли делать ставки в размере от 0
до 25 центов в каж дом из четырех раундов пари. Эти четыре ставки были
усреднены, чтобы дать отдельный счет для каждого испытуемого. Средняя
ставка для испытуемых при условии противник-щ еголь была 11.04 цента
по сравнению с 16.25 центов для испы туемы х в условии растяпы (t = 2.39,
р < 0 .0 2 5 ). Различием еж ду этими двумя группами должно быть даже более
очевидно, когда мы исследуем первые сделанные ставки, так к ак первый
тур пари наиболее близко соответствовал экспериментальной манипуляции.
270 КОВАРИАЦИЯ И КОНТРОЛЬ
Средняя первая ставка для условия противник-щ еголь была 9.28, в то вре­
м я к а к средн яя п ервая ставка для условия растяпы бы ла 16.72 (t = 3.16,
р < 0.005).
Концептуальное испытание манипуляции. Чтобы проверить предположе­
ние, что испытуемые из Йельского университета ожидают, что привлекатель­
ны й противник поставит больше, чем непривлекательный, две анкеты были
предъявлены случайным выборкам старш еклассников Йельского универси­
тета. В первой анкете были описаны задача и участники, и испытуемых спро­
сили, кто, к ак они думали, поставит на кон больше. Двенадцать из 16 испы­
туемых предположили, что привлекательный человек поставит на кон боль­
ш е (хг —4, р < 0.05). Во второй анкете описывалась задача, и у людей спроси­
ли, сколько бы они поставили на кон при каждом испытании. Все 15 человек
опрошенных испытуемых ответили - максимальную ставку (25 центов).

Эксперимент 2: Влияние выбора на иллюзию контроля


И снова мы предположили, что, когда случайная ситуация уподобляется
ситуации навы ка, люди ведут себя, к ак будто они контролирую т неуправ­
ляемое событие, даж е когда ф акт, что успех или неудача зависят от случая,
сущ ественен. Л отерея обеспечивает идеальное средство для исследования
иллю зии контроля, потому что, кроме реш ения покупать билет или нет,
исход полностью управляется случаем. Если бы человек мог управлять ис­
ходом лотереи, можно было бы увеличить вероятность выбора билета. Этот
билет имел бы тогда большую ценность, чем билет, принадлеж ащ ий чело­
веку без этого контроля. И если бы он имел большую ценность, можно было
бы требовать большую цену от потенциального покупателя.
В следующем исследовании лотерея проводилась чтобы, оценить влия­
ние выбора, - важ ны й ф актор в ситуации навы ка, - на иллю зию контроля.
Бы ло спрогнозировано, что испытуемые, которым давали выбрать лотерей­
ный билет, потребуют более высокой цены за него.

М ет од
Испытуемые. Билеты лотереи были доступны служащим офиса мужского и женского
пола, которые работали в одной из двух фирм, расположенных в Лонг-Айленде, стра­
ховом агентстве и производственной компании.1 Так как различные розыгрыши и
спортивные фонды были не редкостью в этих офисах, оправдания для проведения дан­
ной лотереи были не нужны. За исключением четырех женщин, все служащие, к кото­
рым подходил агент, распространяющий лотерейные билеты, купили билет. Испытуе­
мых наугад разделили на группы так, что в итоге было 24 мужчины и 3 женщины в
условии выбора и 23 мужчины и 3 женщины в условии без выбора.

Фирмы пожелали остаться анонимными


Иллюзия контроля 271
Материалы . Билеты лотереи были стандартными 4x2 дюйма (10.16 х 5.08 см) фут-
больными карточками. На каждом билете был изображен известный футболист, его
имя и его команда. Карточки были упорядочены по алфавиту сначала по названию ко­
манды, а затем по имени отдельного игрока. Было два одинаковых набора билетов из
227 футбольных карточек. Каждый испытуемый хранил у себя билет из одного набора,
атакой же билет из другого набора был отложен в картонную коробку, из которой побе­
дивший билет был бы позже отобран.

Процедура . Лотерея проводилась служащим страхового агентства мужского пола и


служащим производственной фирмы женского пола за неделю до игры Суперкубка 1973 г.
Оба экспериментатора не знали о гипотезе эксперимента. Каждый из них подходил к
служащим соответствующего офиса и спрашивал их, не хотят ли они купить лотерей­
ный билет, стоимостью $ 1. Испытуемым сказали, что билеты продавались также в
другом офисе (говорилось название другого офиса) и что полный выигрыш, приблизи­
тельно $ 50, уйдет победителю. Испытуемым также сообщили дату розыгрыша. Согла­
сившись участвовать в лотерее, первому испытуемому была дана коробка с билетами, и
ему (ей) сказали выбрать билет(ы), какой(ие) ему(ей) больше нравился(ись). Испытуе­
мые называли билет так, чтобы экспериментатор мог выбрать тот же самый билет из
второго набора и положить его в закрытую картонную коробку. В это время экспери­
ментатор также записывал имя испытуемого и выбранный им билет. Со вторым испы­
туемым повторили ту же процедуру, за исключением того, что после согласия принять
участие в лотерее, ему давали карточку, которая соответствовала выбору предшеству­
ющего испытуемого. Испытуемые были, таким образом, в условии выбора или усло­
вии без выбора. На следующий день после того, как билеты были проданы в одном офи­
се, та же самая процедура была выполнена во втором офисе.

Зависимые измерения. Ко всем испытуемым индивидуально подходил экспериментатор,


у которого они купили билет, в утро розыгрыша лотереи. Каждому из них сказали: “Один
человек в другом офисе хотел принять участие в лотерее, но так как я больше не продаю
билеты, он спросил меня, чтобы я выяснил, за сколько Вы бы продали свой билет. Для
меня это совершенно не важно, но какую цифру я должен сообщить ему?” Указанная
сумма составила зависимое измерение. Если испытуемый говорил, что он не будет прода­
вать билет, экспериментатор был проинструктирован, чтобы подталкивать его, пока он
не назовет сумму, и затем делать запись ответа “не продаст” рядом с количеством, кото­
рое он наконец предложил.

Р езульт ат ы
К ак было спрогнозировано, м анипуляция выбора имела значительное вли­
яние на цену билета лотереи. Среднее количество денег, за которое испы ­
туемы й хотел продать свой билет было $ 8.67 в условии вы бора, и только
$ 1.96 в условии без выбора (t = 4.33, р < 0.005). Х отя их спраш ивали, за
сколько они продадут свой билет, а не, хотят ли они его продать, 15 испыту­
емых первоначально ответили, что они его не продают. Из них 10 испытуе­
мы х были в условии выбора и 5 - в условии без выбора (р < 0.10). Упомяну­
тое различие не являлось просто функцией сумм, указанны х этими испы ­
туемыми после понуж дения, так к ак их ответы располагались от $ 3 до пол­
ной суммы вы игры ш а в $ 53, причем только 3 испытуемых были в после­
дней категории.
272 КОВАРИАЦИЯ И КОНТРОЛЬ
Не будучи особенным образом проверенным до последующего исследо­
вания, один из результатов, полученных в этом исследовании, касается вли­
ян и я осведомленности на иллю зию контроля. Ж енщ ины не столь знакомы ­
ми с игрой в футбол, к ак мужчины. Следовательно, менее вероятно, что они
согласятся играть в лотерею, а если они все ж е согласятся, они долж ны тре­
бовать меньш его количества денег, за свой билет. Н ужно вспомнить, что
только 4 человека отказались участвовать в лотерее, и что все они были ж ен­
щ инами. И з шести ж енщ ин, которые согласились участвовать в лотерее,
четы ре попросили $ 1, и две попросили $ 2 за свои билеты. Таким образом,
средняя сумма для ж енщ ин была $ 1.33,посравнению с $ 5.89 для мужчин
(t = 2.14, р < 0 .0 5 )....

В ы вод ы и и х зн а ч е н и е д л я п р а к т и к и
Н а основе только что предоставленных сведений, каж ется, что испытуемые
не отличаю т событий, определенных случаем, от событий, определенных
навы кам и так, к ак предложено их определениями. Объективное непредви­
денное обстоятельство не является критической переменной, определяющей
поведение испытуемых. Вместо этого, они реагирую т на событие так, к ак
будто оно является управляемы м, в значительной степени зависит от ф ак­
торов таких к ак конкуренция, выбор, знакомство с ситуацией и вовлече­
ние, которы е могут быть ортогональными по отношению к ф актическому
непредвиденному обстоятельству. К ак было показано, это очень важ но даже
в ситуациях, которые управляю тся случаем, таких к ак лотерея....
Почему это происходит? Люди заинтересованы в том, чтобы управлять
своей окруж аю щ ей средой. Важность контроля в этом контексте ш ироко
обсуждалась как психиатрами, так и исследователями в области социальных
наук. Рассматривается ли это к ак потребность в компетентности (W hite,
1959), инстинкт обладания (H endrick, 1943), стремление к превосходству
(A d ler, 1930) и ли стрем лен и я к личной причинной обусловленности
(deCharm s, 1968), большинство социологов согласны с тем, что человек за­
интересован в том, чтобы управлять своей окружаю щ ей средой, и полная
власть вклю чила бы способность “победить случай”, то есть управлять слу­
чайны ми событиями. Чем труднее проблема, тем более компетентным чув­
ствует себя человек в способности реш ить ее. Поэтому самое большое удов­
летворение или чувство компетентности следовали бы из способности уп­
равлять тем, что не поддается контролю ....
В дополнение к заинтересованности в управлении, сущ ествует другая
причина для отсутствия различения между управляемыми и не поддающи­
м ися контролю событиями. Это то, что навы к и случайные факторы близко
связаны в опыте людей. То есть существует не только заинтересованность в
том, чтобы не различать их, но и сущ ествует трудность в различении, так
к ак в каж дой ситуации навы ка присутствует элемент случая, и элемент
навы ка присутствует почти в каж дой ситуации случая. Первое, очевидно и
Иллюзия контроля 273
не нуж дается ни в каком дальнейш ем объяснении. Примеры второго - это
знание того, какую ставку лучш е сделать в игре в кости (то есть, знание ве­
роятности) или знание, каки е игорные автоматы могут дать самый высо­
кий вы игры ш ....
17. Результаты тестов - такие, какими Вы их себе
представляете*

Лорен Дж. Чепман и Джин Чепман

К аж ды й день психиатры и клинические психологи долж ны приним ать


ж изненны е реш ения:
Какова его проблема? Нужно ли его поместить в психиатрическую боль­
ницу? Есть ли действительно риск, что он совершит убийство или само­
убийство? Этого пациента уже можно выписывать или он должен остать­
ся?
Д ля помощи в этих реш ениях клинические психологи почти всегда ис­
пользую т психологические тесты.
Согласно обзору Н ормана Сандберга (N orm an Sundberg), два наиболее
ш ироко используемые теста - тест чернильных пятен Рорш аха и тест “Р и ­
сунок человека” (ТРЧ). Оба теста - проективные, основанные на предпосыл­
ке, что человек проектирует часть своей личности, когда он реагирует на
неоднозначную, неструктурированную ситуацию . Н апример, так к ак нет
н икаких объективных форм в тесте Рорш аха, то, что человек в нем видит,
возможно, отраж ает его собственные стимулы, конф ликты и индивидуаль­
ность. Точно так ж е, когда кто-либо рисует человека на чистом листе бума­
ги , он, к ак предполагаю т, проектирует часть себя в свое творение.

С о б ств ен н ая л и ч н о с ть
Н аш е недавнее исследование говорит, что тесты Рорш аха и ТРЧ могут быть
проективны ми более, чем в одном направлении. В интерпретации резуль­
татов этих тестов, среднестатистический клинический психолог может про­
ектировать свои собственные предубеждения и предположения в свое опи­
сание пациента.

*Эта книга первоначально появилась в Psychology Today, ноябрь 1971, стр. 18-22,106-110.
Авторское право ©. 1971 Ziff-Davis Publishing Со. Переиздано в соответствии с разрешени­
ем.
Результаты тестов... 275
Н аш и первые исследования в этой области были с рисуночным тестом, в
котором клинический психолог дает испытуемому карандаш и чистый лист
бумаги и просит, чтобы он нарисовал человека. К арен М ачовер (K aren
M achover) издала этот тест в 1949. Она описала рисунки, обычно нарисо­
ванны е людьми с различны ми эмоциональными проблемами, и объяснила,
к ак интерпретировать несколько характеристик рисунков к ак клю чей к
индивидуальности. Она сказала, например, что “человек, больной параной­
ей, придает много графического акцента глазам ”, и “человеку того пола, у
которого нарисована голова большого размера предоставлена больш ая ин­
теллектуальная и социальная власть”.
Руководство к тестам М аховер отмечено далеко идущ ими обобщениями
относительно того, какие виды людей рисуют каки е виды рисунков, но она
представила очень мало подтверждаю щ их данных.

Ч асти тел а
Н екоторые клинические психологи не ж елали принимать на веру работу
Мачовер; они проверили ее утверж дения экспериментально. Ж ю ль Холз-
берг (Jules H olzberg) и Мюррей Векслер (M urray W exler), например, пробо­
вали определить, действительно ли люди, больные паранойей, лучш е про­
рисовывают глаза. Они сравнили рисунки 18 пациентов, больных паранои­
дальной ш изофренией и 76 студентов, обучаю щ ихся на медсестер, но не
наш ли никакого различия в том, к ак эти две группы рисовали глаза.
М ножество подобных исследований проверили прогнозы М аховер отно­
сительно других рисуночных характеристик - головы, уш ей, губ, волос,
одежды, рта, и т.д., — но снова и снова признаки ТРЧ не были подтвержде­
ны. Н есколько экспериментаторов обнаружили, что более уравновешенные
испытуемые имеют тенденцию рисовать более полные рисунки, но главное
заклю чение из данны х исследования - то, что определенное содержание
рисунка не валидны й показатель характеристик личности.

П р и зн а к
Необходимо указать, что этот тип исследования не требует совершенной
дискриминации. Если 50 процентов гомосексуалистов рисуют фигуры од­
ним способом, и только 25 процентов других людей рисует фигуры этим ж е
способом, характеристика рисунка может все еще рассматриваться как ва­
лидны й диагностический признак, так к ак в конечном счете, он может вне­
сти информацию к диагнозу гомосексуализма.
Больш инство клинических психологов знает об исследованиях, показы ­
ваю щ их, что признаки ТРЧ недействительны, все ж е многие ты сячи про­
должаю т использовать тест регулярно, потому что они заявляю т, что при­
знаки работают в их собственной клинической практике. “Я буду скорее
доверять своим собственным чувствам, чем некоторой статье из ж урнала”, -
276 КОВАРИАЦИЯ И КОНТРОЛЬ
сказал один клинический психолог. “Я знаю , что больные паранойей, к а ­
ж ется, не рисую т большие глаза в исследовательских лабораториях, - ска­
зал другой, - “ но они точно рисуют их в моем кабинете”.

И л л ю зи я
Некоторые кри тики говорят, что клинические психологи так захвачены
своими теориями и традициями, что они не замечают фактов. Мы думаем,
что сущ ествует другое объяснение. Клинический психолог, который про­
долж ает доверять ТРЧ, даж е если ему представить очевидные опроверже­
н ия, мож ет испы ты вать ложную корреляцию, явление, которое мы обнару­
ж или несколько лет назад в исследовании относительно словесных ассоци­
аций.
Мы обнаружили, что слова, которые тесно связаны друг с другом, замеча­
ются вместе чащ е чем, это действительно бывает. В этих экспериментах ис­
пытуемый сидел на удобном стуле, в то время, к ак мы проектировали раз­
личны е пары слов (например, бекон — тигр) на большой экран перед ним.
Пары слов менялись каж ды е две секунды. Слово с левой стороны пары было
всегда одно из четырех возможных слов: бекон, лев, бутоны или лодка. К аж ­
дое слово появилось так ж е часто, как любое другое (25% ), но оно оказы ва­
лось всегда на левой стороне экрана. Слово на правой стороне пары было яйца,
тигр или тетрадь с равной вероятностью появления.
Мы систематизировали пары слов так, чтобы каж дое слово с левой сто­
роной появилось равное количество раз с каж ды м словом с правой сторо­
ной. Н апример, когда слово бекон появлялось на левой стороне, слово яйцо
было в паре с ним в одной третьей части испы таний, тигр в другой трети
испы таний, а тетрадь — в оставш ейся трети. Но когда мы позж е спросили
испытуемых относительно пар слов, они сказали, что, когда слово бекон
появлялось слева, слово яйца ш ло с ним в паре 47% от времени, и что, когда
лев был слева, тигр был тем словом, которое наиболее часто появлялось
справа. Д аж е при том, что каж дая пара слов появлялась так ж е часто, как
лю бая другая, испытуемые заявляли , что пары с сильной вербальной ассо­
циацией появлялись более часто, чем другие.
Мы назвали тенденцию видеть две вещ и, появляю щ имися вместе более
часто, чем они ф актически появляю тся, ложной корреляцией.
Видимо, имеется существенное подобие между студентами, которые за­
являю т, что некоторые слова появляю тся вместе чащ е, чем на самом деле, и
клиническим и психологами, которые утверждаю т, что видели валидность
в признаках теста ТРЧ, когда исследование говорит, что ее нет.

И н терп ретац и я
П ризнаки ТРЧ и интерпретации могут отличаться сегодня от того, каким и
они бы ли, когда М аховер представила тест, более чем 20 лет назад. Поэтому
Результаты тестов... 277
мы спросили современных учены х, к ак они используют тест. Мы послали
анкетные опросы 110 клиническим психологам, которые являлись лидера­
ми в диагностическом тестировании. Мы написали краткие описания шес­
ти типов пациентов и попросили, чтобы каж ды й психолог сообщил нам,
каки е характеристики он видел в рисунках каждого. Эти ш есть описаний
были: (1) “он обеспокоен тем, насколько он муж ественный,” (2) “он подо­
зрителен к другим лю дям”, (3) “он обеспокоен тем, насколько он умен”, (4)
“он обеспокоен тем, что его корм ят и о нем заботятся другие лю ди”, (5) “у
него были проблемы с сексуальной потенцией” и (6) “он очень обеспокоен
тем, что люди говорят о нем плохо”. Мы попросили психологов определить
в каж дом случае, какой пациент, нарисовал какого человека.
Мы получили 44 заполненных анкеты , и было ясно, что психологи со­
глаш ались друг с другом относительно характеристик рисунка, которые они
видели в каж дом случае. Например, большинство психологов (91% ) сказа­
ло, что подозрительный пациент будет рисовать большие или необычные
глаза. 82% сказали, что человек, обеспокоенный своим интеллектуальны м
уровнем, будет иметь тенденцию рисовать большую или выделенную голо­
ву (см. табл. 1).
Согласие не было абсолютным, но было внуш ительным. Вообще, психо­
логи согласились по поводу двух или трех характеристик рисунка, которых
они будут ож идать от каж дого типа пациента.

П ары
Больш инство психологов имело кандидатскую степень и в среднем 8,4 лет
опыта в психодиагностике. Интересно, каки е признаки ТРЧ обнаружили
бы наблю датели, у которы х не было почти никакого опыта.
Чтобы выяснять это, мы собрали 45 рисунков мужских фигур - 35, нарисо­
ванных психическими больными в близлежащей государственной больнице и
10 рисунков, выполненные аспирантами в области клинической психологии. Мы
измерили размер головы в каждом рисунке, размер глаз и т.д., и попросили не­
зависимых людей оценить рисунки на предмет более субъективных характери­
стик, таких как муже- или женоподобие.
К каж дом у рисунку мы прилож или два из ш ести диагнозов, которые мы
вы сы лали психологам - например, “человек, который нарисовал это: (1)
подозрителен к другим лю дям и (2) имел проблемы с сексуальной потенци­
ей”. Имелось 15 отличных пар, которые могли быть получены из этих ш ес­
ти утверж дений, так что мы использовали каж дую пару на трех различны х
картинах.
Мы приписывали диагнозы систематически всем типам рисунков. Н апри­
мер, предложение: “он обеспокоен тем, насколько он умен” появлялась так
ж е часто на рисунках с маленькими головами, к ак и на рисунках с большими
головами.
278 КОВАРИАЦИЯ И КОНТРОЛЬ
Затем мы отобрали группу студентов колледж а и выбрали 108 человек,
которы е заявили, что они никогда не слыш али о рисуночных тестах и не
знаю т ничего относительно того, к ак они интерпретирую тся.
Мы опросили студентов в группах. Перед каж ды м опросом мы кратко
объяснили суть ТРЧ . Мы сказали, что студент увидит ряд рисунков, н аря­
ду с кратким и утверж дениями относительно диагноза людей, которые на­
рисовали их. Мы сказали, что у многих людей были одинаковые проблемы,
и что студенты долж ны тщ ательно исследовать картинки и поискать общие
характеристики в рисунках людей с одинаковой проблемой. Студенты про­
смотрели рисунки в заранее спланированном случайном порядке, останав­
ливаясь на каж дом в течение 30 секунд.

Подтверждение
Х отя мы тщ ательно сбалансировали картинки и диагнозы так, чтобы не было
н икаки х объективны х связей между ними, почти каж ды й испытуемый со­
общ ил, что он видел эти связи. И связи, которые студенты обнаружили, были
подобны тем, которы е видели психологи в своей еж едневной практике.
Имелись некоторые различия, конечно, но студенты имели тенденцию опи­
сы вать обычный рисунок каж дого типа пациента в тех ж е самых терминах,
которы е использовали психологи. И в случае студентов, мы знаем, что при­
знаки были иллю зорны, потому что о них не сообщалось в данных.
Наш е предыдущее исследование относительно пар слов предлагает объяс­
нение: вспомните, что мы обнаружили, что слова с сильными ассоциатив­
ными связям и имеют тенденцию быть замеченными появляю щ имися вме­
сте. Возможно, тот ж е самый механизм был и у признаков ТРЧ. Мы прове­
ли анкетны й опрос по ассоциации слов, чтобы определить, к ак близко обла­
сти симптома (подозрительность, интеллект, импотенция, и т.д.) связаны с
различны ми частями тела (глаза, голова, половые органы, мускулы, и т.д.).
Вопросы им ели следующую форму: “Тенденция слова ПОДОЗРИТЕЛЬ­
НОСТЬ ассоциироваться со словом ГОЛОВА (1) очень сильная, (2) сильная,
(3) умеренная, (4) м аленькая, (5) очень м аленькая, (6) никакой тенденции
нет вообще”.
Мы провели анкетны й опрос 45 студентов, которые не участвовали в дру­
гих частях эксперимента. Вербальные ассоциации, о которых они сообщи­
ли, четко совпадали с ложными корреляциям и, которые “наивны е” студен­
ты видели между характеристиками рисунка и симптомами. Устные ассо­
циации даж е более близко совпадали с корреляциям и, о которых сообщали
практикую щ ие психологи.

О плата
В наш ем следующем эксперименте мы опросили 56 человек в течение трех
дней подряд, чтобы увидеть, осознают ли они, что нет никакой истинной
характеристики обеспокоен- подозрительно обеспокоен- обеспокоенные имели обеспокоен-
рисунков ные, на- относятся к ные, на- тем, что их проблемы ные тем,
сколько они другим людям сколько они кормят и о них с потен- что люди
мужественны умны заботятся другие цией говорят о

1
1
a

a
Ä
3 з-
W СО
§ 3 о

о
о

о
Я

яо
я

Я
И
Ч
а>
о
тН

о
Cg
О

00

00
О
25 31

со
76
СО

М
£& *к
в &
о

о
о
Cg

тН
СЧ1

я
3
ч

гЧ g cg
О
со
43 26

О)
58

I
СО

§

о
ю
Я

Ен
m
от

cg

о
о
тН
С
ь-
О
О)

ю
82 55
СО

со tsi
х

х
гН

cg

о
о
гН
X

fc -

Я
о

3
О

Я
68

Qi

&
о

х
о

о
о
X

тН

ё
55

»Е4*

1 8.S
Я SS И
о

о
cg

о
о

о мо
& я
X

Рч 3

3 юо
64

X Я Я со
55
СО

о
я
3
о
ю
и
cg

cg

cg
14 18 52

О
17 18 44 21 21
Результаты тестов.

О м

Я2

о
о
о R я

Я
Я

00
гН

О
тН

лЕ*
О

Ен
cg
тН
тН

тН
23 25 13
cg
23 22 32 39
детскость
279
280 КОВАРИАЦИЯ И КОНТРОЛЬ

со СО 00 о о о 1—1

о СМ о о о о о

27
со СО см о см м*

гН

18

23
тН ь- см о о


со см о о СО

о о g ^ ° О t-

00
со см о

см «S ° о

СМ СО 00 о о о

см см см

со 00 см

со о ю OS
см см
s й
о Я

ft ф
IgggS
в. S Я 81 ö и ^
g ®

CM СО f t О тИ О ю
-J о о И и « гН
Результаты тестов... 281
корреляции между признаками и рисунками, если предоставить им возмож­
ность увидеть материалы тестирования больше, чем один раз. Корреляции
наблюдались так ж е отчетливо в третий день, к ак и в первый. Мы начали
понимать, насколько сильной может быть лож ная корреляция, и поинтере­
совались, каки е условия, если таковые вообще имею тся, позволят преодо­
леть ее.
Мы опросили еще 41 человека индивидуально и позволили каждому смот­
реть на рисунок, так долго, сколько он хотел. Чтобы поощрить их изучать ри­
сунки тщательнее, мы предложили $ 20 студенту, чьи оценки будут наиболее
точными.
Это не сработало. Студенты видели лож ные корреляции так ж е настоя­
тельно, к ак всегда.
Н аконец мы остановились и дали испытуемым все возможности, кото­
рые могли только придумать, чтобы они могли проверить свое собственное
восприятие. Мы предложили каж дому испытуемому все множество рисун­
ков, чтобы он сам их изучил; мы сказали ему, что он может смотреть на них
в любом порядке столько времени, сколько он хотел. Он мог расклады вать
рисунки в стопки и делать прямы е сравнения. Он мог помесить все рисун­
ки , сделанные подозрительными людьми, в одну стопку и искать подобие в
них. Мы дали каж дому испытуемому бумагу для заметок, карандаш и ли­
нейку; мы снова предложили $ 20 человеку, чьи оценки будут наиболее точ­
ны , и мы дали каж дому испытуемому копию заклю чительного анкетного
опроса, так что он мог видеть то, на каки е вопросы ему придется отвечать.

М у ж ествен н о сть
В этих условиях лож ная корреляция понизилась значительно для большин­
ства признаков, но она не исчезла. Н апример, в нормальных условиях 76%
студентов видели связи между людьми, волную щ имся о своей мужествен­
ности и тенденцией рисовать мускулисты е фигуры; в новых условиях, 45%
все ещ е заявляли, что они видели связи, которых там не было. Л ож ная кор­
реляция сильна и примечательно стойка к любым попы ткам изменить ее.
Студенты даж е утверждают, что видели типичные корреляции, когда ри­
сунки были сложены в противоположном направлении. В одном исследова­
нии, например, мы поместили утверждение, “Его волнует его уровень интел­
лекта” только на рисунках с маленькими головами; утверждение относитель­
но подозрительности появлялось исключительно на рисунках с маленькими
глазами, и т. д. Это несколько уменьшило иллюзорную корреляцию , но не ус­
транило это. Ш естнадцать процентов все равно заявили, что пациенты, кото­
рых волновал их уровень интеллекта, рисовали фигуры с большой головой, а
50% все еще видели отношения между людьми, волнующимися относитель­
но мужественности, и тенденцией рисовать мускулистые фигуры - даже при
том, что истинные связи были противоположными.
282 КОВАРИАЦИЯ И КОНТРОЛЬ
И з наш его исследования очевидно, что клинические интерпретации ТРЧ
содержат сильны й компонент иллю зорной корреляции. И реш ения, кото­
ры е принимаю т психологи относительно их пациентов, могут быть проек­
цией собственных предвзяты х мнений.

П ятн а
Интересно, присутствовали ли иллю зорные корреляции в наиболее попу­
лярном испы тании из всех - чернильные пятна Рорш аха - и если так, будут
ли они замечены так ж е ясно, к ак и истинные корреляции, те немногие при­
знаки Рорш аха, которые считаю тся валидными индикаторами некоторых
характеристик личности.
В 50-летней истории теста Рорш аха, многие психологи сообщили, напри­
мер, что определенные ответы даются более часто гомосексуалистами, чем
другими людьми. В 1949, Уильям Уилер (W illiam W heeler) суммировал 20
признаков гомосексуализма по Рорш аху. Другие исследователи проверили
признаки Уилера, но только 2 из 20 признаков были сочтены валидными бо­
лее, чем одним исследователем. Один из них (номер семь), - реакция на чет­
вертое чернильное пятно, — “человек или животное, искаженное, чудовищ­
ное или угрожаю щ ее.” Другой валидный признак, - восьмой у Уилера, - со­
общение о странной фигуре животного-человека на пятой карте.

П р и зн а к и
Чтобы исследовать, к ак психологи ф актически используют тест Рорш аха,
для диагностики гомосексуализма, мы послали анкету 76 психологам, по­
просив и х, описать две перцепции, которы е гомосексуальные пациенты
обычно видят в 10 пятнах Рорш аха. Из психологов, которые возвратили за­
полненные анкетны е опросы, 32 сказали, что они видели протоколы Рор­
ш аха, касаю щ иеся гомосексуалистов. Эти 32 специалиста описали несколь­
ко признаков Рорш аха, но из тех, что они упомянули, наиболее частыми
были (1) ягодицы или задний проход, (2) гениталии, (3) ж енская одежда, (4)
человеческие фигуры неопределенного пола, без ясны х м уж ских или ж енс­
ки х признаков, и (5) человеческие фигуры, к ак с м уж ским и, так и с ж енс­
ким и признаками. Все это - признаки Уиллера, которые не были подтверж­
дены исследованием. С другой стороны, только два психолога упомянули
валидны й признак номер 7 - искаж енная, чудовищ ная фигура, и ни один
не упомянул другой валидны й признак, номер 8 — “полу-человеческая-
полу-ж ивотная” фигура.
Н екоторые психологи видели признаки в тесте Рорш аха, которы х не
было, и не могли увидеть признаки, которые там были. И вновь наш е иссле­
дование с вербальными ассоциациями предлагает клю ч к разгадке. Два ва­
лидны х признака не интуитивны: гомосексуализм не ассоциируется ни с
ры чащ ими ж ивотны ми, ни с человеко-животными гибридами. Но гомосек­
Результаты тестов... 283
суализм имеет высокую вербальную ассоциацию с пятью признакам и, о ко­
торых клиницисты сообщали наиболее часто. Так или иначе, разумно ож и­
дать, что гомосексуалисты будут склонны видеть ягодицы , женскую одеж­
ду или фигуры неопределенного пола в чернильных пятнах.

И деи
Мы проверили эти понятия объективно, попросив 34 независимых студен­
тов оценить, к ак сильно слово “гомосексуализм” ассоциирует с различны ­
ми идеями. И х оценки совпадали - популярные, но невалидные признаки
имеют более сильную вербальную ассоциацию с гомосексуализмом чем, два
непопулярны х, но валидны х признака. Это предполагает, что признаки го­
мосексуализма, которые как утверждают пихологи, они видели в тестах Рор­
ш аха, могли просто отразить их собственные предположения и ож идания.
Мы проверили это утверждение с помощью проекта, подобного тому, ко­
торый мы проводили в рисуночном тесте. Мы получили несколько карт Рор­
ш аха, и к каж дой мы прилож или ответ - некоторый образ, который чело­
век, предположительно, заметил на карте. Область карты , которая относи­
лась к ответу, была обведена кругом.
Н а некоторых чернильны х пятнах ответ был валидным признаком гомо­
сексуализма (например, “гигант с морщ инистыми рукам и”), на других, от­
вет был невалидным признаком (например, “ш нурованный ж енский кор­
сет”), а на третьих, это был нейтральны й признак (например, “карта Испа­
нии”). Н иже ответа были два описания человека, который проходил тест. Мы
выбрали эти описания из всех возможных пар из группы, состоящей из четы­
рех описаний: (1) “он проявляет сексуальное влечение к другим мужчинам”,
(2) “он полагает, что другие люди сговорились против него”, (3) “он испыты­
вает грусть и депрессию в течение длительного времени” и (4) “у него силь­
ное чувство собственной неполноценности. ” Мы, конечно, были больше всего
заинтересованы первым утверждением.

С м еш и в ан и е
К ак в исследованиях ТРЧ, мы систематически приписывали утверж дения
признака к картам так, чтобы не было н икаких последовательных связей
между любым из утверждений и любым признаком.
После того, к ак студенты просмотрели несколько карт, мы спросили их,
каки е образы увидели пациенты с каж ды м из четы рех типов признаков.
Студенты сообщили, что гомосексуалисты более часто видели ягодицы , ге­
ниталии, и т.д ., - то есть, те ж е самые п ять невалидны х признаков, о кото­
ры х сообщили психологи. Ни один из студентов не увидел связи между го­
мосексуализмом и двумя валидны ми признакам и.
В более поздней вариации теста мы преднамеренно ввели отрицательную
корреляцию в материалы теста, так, чтобы утверждение “Он испытывает
284 КОВАРИАЦИЯ И КОНТРОЛЬ
сексуальное влечение к другим муж чинам” никогда не появилось на карте,
которая была воспринята к ак ж енская одежда, ягодицы, и т.д. Это не умень­
ш ило ложную корреляцию - студенты видели ее так ж е четко, к ак прежде.

С в я зь
Эти исследования показываю т насколько легко полагать, что два независи­
мы х события связаны , особенно, когда существует некоторая субъективная
вербальная ассоциация между ними. Н аш и испытуемые видели сильные
лож ны е корреляции между симптомами и признакам и проективны х тес­
тов в краткой, структурированной задаче. Задача психолога, безусловно,
намного сложнее. Проблемы реального пациента многочисленны и неопре­
деленны , - редко когда пациент имеет только два четко определенных при­
зн ака. И реальны е пациенты проявляю т много различны х реакций в про­
ективны х тестах, а не только одну. Такж е вероятно, что в реальной практи­
ке иллю зорные корреляции, которые психолог наблюдает, усиливаю тся со­
общ ениями его коллег-психологов, которые непосредственно подвержены
тем ж е самым иллю зиям. Согласие усиливает иллю зии. Н аш им студентам,
с другой стороны, не позволяли говорить друг с другом в течение теста, так
что каж ды й увидел свои собственные ложные корреляции. Вот почему ве­
роятно, что практикую щ ие психологи имеют дело с лож ными корреляция­
м и, которые являю тся даже более сильны ми, чем те, о которых сообщили
наш и испытуемые.

Т р у д н о сти
Мы не хотим сказать, что клинические психологи некомпетентны или сле­
пы к ф актам , к ак некоторые могли бы заклю чить. Н аш и данные указы ва­
ют не на некомпетентность психолога, а на чрезвычайную трудность его за­
дачи. Психологи подвержены тем ж е иллю зиям , что и другие люди. По ана­
логии, почти все говорят, что две горизонтальны х линии имеют различны е
длины , когда они рассматриваю т рисунок М ю ллера-Лайера (M iiller-Lyer):

>---------------------------------- ---------------------------------- <


<---------------------------------- ---------------------------------- >

но никто не назы вает плотника некомпетентным в оценке расстояния про­


сто, потому что он такж е подвержен иллю зии.
Психологи должны знать о ложной корреляции, если они хотят избавить­
ся от нее. В идеале, психолог первый, кто должен испытывать такие иллю ­
зии. Н ормальная политика обучения - требовать от каж дого аспиранта в
области клинической психологии, побыть наблюдателем в задачах подоб­
ны х тем, которые мы описали. Он мог сам изучать величину и источник лож ­
Результаты тестов... 285
ны х корреляций, которые он испытывает и, таким образом, к ак мы надеем­
ся, научиться принимать меры против таких ошибок в своей клинической
практике.
Опыт такж е напомнил бы ему, что он склонен ош ибаться, основываясь
на чувствах, что его клинические оценки должны постоянно проверяться с
помощью объективных измерений, и что его профессиональная задача я в ­
ляется одной из наиболее трудных и сложны х в психологии.
18. Вероятностные рассуждения в клинической
медицине: проблемы и возможности*

Дэвид М. Эдди

В значительной степени, качество и себестоимость здравоохранения опре­


деляю тся реш ениям и, которые принимаю т врачи, чья окончательная цель
состоит в том, чтобы разработать и управлять программой лечения для улуч­
ш ения состояние пациента . Больш инство реш ений вклю чаю т много ф акто­
ров, большую неопределенность и трудные вопросы, касаю щ иеся ценнос­
тей.
Эта глава рассматривает один из аспектов того, к ак эти реш ения прини­
маю тся, изучая использование вероятностного рассуж дения для анализа
специфической проблемы: делать ли биопсию женщ ине, у которой имеется
новообразование в груди, которое может быть злокачественным. В частно­
сти, мы изучим, к ак врачи обрабатывают информацию относительно резуль­
татов маммограммы и рентгеновского сним ка для диагностики рака груди.
П редоставленные данные показываю т, что врачи не очень хорошо справля­
ю тся с неопределенностью, что многие врачи допускают серьезные ош ибки
в вероятностном рассуждении, и что эти ош ибки угрожаю т качеству меди­
цинского обслуж ивания.

П р о б л ем а
Биопсия груди - не тривиальная процедура. Наиболее обычный вариант
(около 80% ) - ампутационная биопсия, при которой подозрительная опу­
холь удалятся хирургическим путем для микроскопической экспертизы и
гистологического диагноза патологом. Обычно пациент кладется в больни­
цу и проходит полный набор дооперационных диагностических процедур.
Биопсия почти всегда делается под общей анестезией (с вероятностью смер­
ти от анестезии приблизительно в 2 из 10. 000 случаев). Делается малень­

*Подготовка этой книги была поддержана грантом от семейного фонда Генри Дж. Кэйсера.
Вероятностные рассуждения... 287
кий (от 1 до 2 дюймов) разрез и удаляется ткань размером от ореха до сливы.
Во многих случаях (возможно 1 из 2) потеря ткани практически незаметна;
в других - сохраняется небольшое углубление. В редких случаях (возмож­
но 1 из 200) организм подвергается воздействию инф екции, которая может
сохраняться в течение нескольких недель. Это стоит приблизительно $700.
Эта процедура может быть сделана в амбулаторных условиях и под местной
анестезией. К ак альтернативу к ампутационной биопсии, некоторые хирур­
ги предпочитаю т получать образец ткани, используя иглу. Это мож ет быть
сделано в амбулаторных условиях, без шрамов или других остаточных эф­
фектов, и гораздо дешевле. Однако по мнению многих врачей, этот опыт яв ­
ляется менее надеж ны м, потому что злокачественное образование может
быть пропущ ено.
Важный ф актор, который определяет необходимость биопсии - возмож­
ность того, что опухоль в груди - раковая. Чтобы оценить эту возможность,
врач может перечислить возможные болезни, оценить частоты, с которыми
различны е признаки и симптомы сопутствуют каж дой болезни, сравнить
эту информацию с результатами пациентки, оценить вероятность, что у нее
есть одна из болезней в списке и провести биопсию, если вероятность рака
или другого заболевания достаточно высока. Чтобы помочь врачу, многие
учебники описывают, чем доброкачественные болезни отличаю тся от рака.
Н апример, следующ ий абзац описы вает одну такую доброкачественную
болезнь - мастопатию.
Мастопатия часто путается с карциномой груди. Она обычно бывает у рожавших жен­
щин с маленькой грудью. Наиболее часто она встречается в верхнем внешнем квадран­
те, но может находиться в других частях, и, в конечном счете, охватывать всю грудь.
Она часто болезненна, особенно в предменструальный период, и обычно сопровождает­
ся менструальными расстройствами. Выделения из сосков, обычно серозные, наблюда­
ются в приблизительно 15% случаев, но отсутствуют какие-либо изменения непосред­
ственно в соске.Новообразование не имеет четко ограниченной формы и не прилегает к
коже. Многочисленные кисты плотные, круглой формы и колеблющиеся, а также мо­
гут просвечиваться, если содержат прозрачную жидкость. Большая киста при масто­
патии на ощупь подобна опухоли, но обычно она более гладкая и хорошо ограниченная.
Подмышечные лимфоузлы обычно не увеличиваются. При мастопатии редко наблюда­
ются большие синеватые кисты. Чаще наблюдаются многочисленные и маленькие ки­
сты.1(Del Regato, 1970, с. 860-861)

Подобные описания существуют для фиброаденомы, жирового некроза,


травмы и полдю жины других болезней груди, вплоть до рака.
Этот тип вероятностной информации может использоваться, чтобы по­
мочь врачу проанализировать возможные причины новообразования в гру­
ди у пациентки. Рассматривая возможные исходы (например, верно диаг­
ностируя рак, делая ненужную биопсию доброкачественного новообразова­
ния, не делая биопсии и пропуская злокачественные опухоли, и правильно

1В э т и х и последую щ их ц и т а т а х добавлено вы деление курсивом .


288 КОВАРИАЦИЯ И КОНТРОЛЬ
реш ая не подвергать биопсии доброкачественные опухоли), врач может оце­
нить вероятность того, что пациентка, с ее специфическими признакам и и
симптомами, больна раком, и затем реш ить, к ак действовать дальш е.

И спользование маммографии
Существуют и другие диагностические процедуры, помогающие врачу оце­
нить вероятность того, что грудное образование отдельно взятой женщ ины
является злокачественным. Возможно, наиболее важ ная и обычно исполь­
зуем ая из них - маммография. Суть этого испы тания состоит в том, что ком ­
поненты раковы х клеток поглощают рентгеновские лучи иначе, чем ком­
поненты доброкачественных клеток. И зучая мамограммы, рентгенолог мо­
ж ет увидеть некоторые признаки, которые наблюдаются с различны ми ч а­
стотами в различны х образованиях, и , исходя из этой информации, делает­
ся оценка относительно характера рассматриваемой болезни. К ак правило,
результат маммограммы классиф ицируется к ак положительный или отри­
цательны й в отнош ении рака. И ногда используется расш иренная схема
классиф икации, такая, например, к ак схема, содерж ащ ая три класса: зло­
качественны й, подозрительный и доброкачественный.
Эта диагностическая процедура не соверш енна, так к ак в ней некоторые
злокачественные повреждения неправильно классифицирую тся к ак добро­
качественны е, и некоторые доброкачественные опухоли классифицирую т­
ся как злокачественные. Таким образом, один из факторов, который яв л я­
ется очень важ ны м для врача - точность диагностики.

Вероятностное рассуждение
Давайте рассмотрим это понятие более подробно. Цель диагностической про­
цедуры состоит в том, чтобы обеспечить врача информацией о состоянии
пациента. Врач использует ее для пересмотра состояния пациента и опреде­
ления, к ак действовать, исходя из новой оценки. Это мож ет быть решение
пройти дальнейш ие диагностические процедуры, или если врач достаточно
уверен в состоянии пациента, мож ет быть принято реш ение о терапии. Су­
щественно то, что врач может иметь различны е степени уверенности о со­
стоянии пациента. Врач будет собирать данные, чтобы усилить уверенность
в том, что у пациента есть или отсутствует рак, и когда эта уверенность ста­
нет достаточно сильной (в контексте серьезности болезни и изменений в про­
гнозе и лечении), будут предприняты действия.
Мы мож ем связы вать вероятность, то есть субъективную вероятность
врача, что у пациента рак, с этой степенью уверенности. Результаты раз­
личны х диагностических процедур, таких, к а к , например, маммография,
могут сущ ественно изменить уверенность врача или субъективную вероят­
ность того, что у пациента рак.
Вероятностные рассуждения... 289
П онятие субъективной вероятности или степени уверенности появляет­
ся в различны х формах в профессиональном медицинском жаргоне. Н апри­
мер, один автор пиш ет, что “так к ак старш ая возрастная группа имеет са­
мую большую пропорцию злокачественных новообразований, в ней повы­
ш енный коэффициент подозрения на рак, по мнению врача, который стал­
кивается с таким пациентом “ (Gold, 1969, с. 162). Другой автор заявляет,
что маммограмма мож ет уменьш ить количество биопсий груди “во многих
случаях, когда сложившееся мнение осматривающего врача относительно
доброкачественной опухоли поддерживается точным маммографическим
диагнозом о доброкачественности” (W olfe, 1964, стр. 253). Третий описыва­
ет это так: “Если субъективное впечатление врача дает достаточно причин
для подозрения карциномы , он будет вынужден прибегнуть к биопсии, не­
смотря на отрицательный результат маммограммы” (Clark и др., 1965, с.
133). Другие вы сказы вания, которые отражаю т это понятие: “уровень уве­
ренности” (В у т е , 1974, с. 37), “впечатление злокачественности” (W olfe,
1967, с. 138), “более положительный диагноз” (Egan, 1972, с. 392), и т.д.
Эти утверж дения не точны, потому что мало врачей формально ознакомле­
ны с понятиями субъективной вероятности и анализа при принятии реше­
ний. Тем не менее, существует вполне достаточное свидетельство того, что
понятие степеней уверенности является естественным для врачей и исполь­
зуется ими для определения, к ак поступать дальш е.

И нт ерпрет ация точности маммограммы


Теперь рассмотрим пациентку с новообразованием в груди, которое врач
считает доброкачественным. Пусть эта вероятность будет 99 из 100. Вы мо­
ж ете интерпретировать фразу, что “врач считает, то вероятно (99 из 100)
новообразование доброкачественно” следующ им образом. Предположим,
что у врача имеется опыт с множеством ж енщ ин, которые, во всех важ ны х
аспектах, таких к ак возраст, симптомы, история семьи и результаты ана­
лизов, подобны этой пациентке. И предположим, что врач знает из своего
опы та, что частота рака в этой группе, скаж ем, 1 из 100. При отсутствии
другой информации, врач припиш ет (возможно, подсознательно) субъек­
тивную вероятность 1% тому, что эта пациентка больна раком.
Теперь пусть врач посылает пациентку на маммограмму и получает сооб­
щ ение, что, по мнению рентгенолога, опухоль является злокачественной.
Это новая информация, и предпринятые врачом действия будут, очевидно,
зависеть от его новой оценки вероятности того, что у пациентки рак. Врач,
которы й обратится к литературе, мож ет найти множество полезны х утвер­
ж дений, так и х , к ак : “точность мам м ограф ии - приблизительно 90% ”
(W olfe, 1966, с. 214); “(У пациенток с новообразованием в груди) положи­
тельны й результат (маммограммы ) карцином ы вы соко точен” (R osato,
Thom as & R osato, 1973, с. 491); и “точность маммограммы при правильном
диагностировании злокачественных опухолей груди составляет в среднем
290 КОВАРИАЦИЯ И КОНТРОЛЬ
от 80 до 85% ” (Cohn, 1972, с. 98). Если необходимо больше подробностей,
врач может обнаружить много утверждений, к ак “результаты показали, что
79,2% от 475 злокачественных новообразований, и 90,4% от 1. 105 добро­
качественны х новообразований были правильно диагностированы, и пол­
н ая точность составила 87% ” (Snyder, 1966, с .217).
Н а этом этапе Вы можете понять сложность проблемы врача, самостоя­
тельно оценив новую вероятность того, что у этой пациентки рак: врач ду­
мает, что опухоль доброкачественна с вероятностью (99% ), но рентгеновский
диагноз был положителен с точностью, только что указанной.

Таблица 1. Точность маммограммы в диагностировании доброкачествен­


ных и злокачественных новообразований

Р езульт ат ы Доброкачест венное


Злокачест венное
рент геновского новообразование (р а к
новообразование (р а к )
обследования от сут ст вует )
Положительный 0.792 0.096
Отрицательный 0.208 0.904

Источник : числа взяты из работы Снайдера (Snyder, 1966).

Д ля оценки вероятности прим еняется формула Байеса. Согласно этой


формуле
Р (рак | пол) =
_______________ Р(пол | рак ) • Р(рак)____________
Р(пол \ рак)Р(рак) + Р{пол jдоброкач )Р (доброкач )

Где
Р (рак|пол) - вероятность того, что у пациентки рак, при условии,
что у нее положительный результат рентгеновского обследования (апо­
стериорная вероятность)
Р (пол|рак) - вероятность того, что если у пациентки рак, рентгено­
лог правильно диагностирует его (истинно полож ительная оценка или
чувствительность)
Р (рак) - вероятность того, что у пациентки рак (априорная вероят­
ность)
Р (доброкач) - априорная вероятность того, что опухоль у пациент­
ки доброкачественная (Р (доброкач) = 1 - Р (рак))
Р (пол|доброкач) - вероятность того, что, если у пациентки доброка­
чественная опухоль, рентгенолог неправильно диагностирует ее как
рак (ложно полож ительная оценка)
Вероятностные рассуждения... 291
В табл. 1 приводится итог чисел, представленных Снайдером (Snyder).
Ц ифры в ячейках - соответствующие вероятности (например, Р (пол|рак) -
0.792).
И спользуя оценку врача априорной вероятности того, что опухоль яв л я­
ется злокачественной и , принимая во внимание новую информацию, полу­
ченную в результате процедуры, мы имеем

TW , ч (0.792 X0.01) п пп п
Р (рак пол) = ---------- --------------------------- = 0.077
(0.792 )(0.01) + (0.096 )(0.99)

Таким образом, врач должен оценить вероятность того, что у пациентки


рак к ак приблизительно 8% .

Н еправильное вероятностное рассуждение


К сожалению , большинство врачей (приблизительно 95 из 100 в неофици­
альной выборке, сделанной автором) неправильно интерпретирует утверж ­
дения относительно точности анализов и оценивает Р(рак|пол), приблизи­
тельно к а к 75% . Другие исследователи получили похож ие результаты
(Casscells, Schoenberger & S; G rayboys, 1978). Когда их спраш ивали, допус­
тивш ие ош ибку врачи обычно отвечали, что они оценили вероятность рака,
при условии, что у пациентки положительный результат рентгеновского об­
следования (Р (рак|пол)) приблизительно равна вероятности положитель­
ного результата рентгеновского обследования у пациентки, больной раком
(Р (пол|рак)). П оследняя упомянутая вероятность измерена в клинических
исследовательских программах и очень известна, но именно первая упомя­
нутая вероятность необходима врачу для принятия реш ения. По-видимо­
му, что многие, если не большинство врачей, путают эти две вероятности.
Н а самом деле существует два типа точности для любого анализа, пред­
назначенного, чтобы определить, действительно ли присутствует определен­
н ая болезнь. Ретроспективная точность касается Р (пол|рак) и Р (отр| не
рак). (Сокращ ение “не рак” относится к случаю, когда пациентка не больна
раком. Это мож ет происходить, потому что у нее либо доброкачественная
опухоль, либо она вообще здорова.) Эта точность, н а которую обычно ссыла­
ются в литературе по маммографии, определяется, обращ аясь к рентгено­
вскому диагнозу после того, к ак истинный (гистологический) диагноз стал
известен. Д авайте, используем термин спрогнозированная точность, для
описания Р (рак|пол) и Р (доброкач|отр), точность, важ ная для врача, у кото­
рого есть рентгеновский снимок пока еще не продиагностированного паци­
ента и которы й хочет сделать прогноз состояния болезни пациента.
Путаница между ретроспективной и спрогнозированной точностью. Об­
зор медицинской литературы по маммографии показывает сильную тенден­
292 КОВАРИАЦИЯ И КОНТРОЛЬ
цию приравнивать спрогнозированную точность положительного результата
рентгеновского обследования к ретроспективной точности рентгеновского
снимка; то есть приравнивать Р(рак|пол) = Р (пол|рак). Существует много
причин подозревать, что эта ошибка постоянно соверш ается. Во-первых,
формулировки многих утверждений в литературе предполагаю т, что их ав­
торы приравниваю т прогнозирующую точность (Р (рак|пол)) и ретроспек­
тивную точность (Р (пол|рак)), о чем они сообщают в своих исследованиях.
Н апример, вст&тьеРентгенологияв 1964 говорилось, что, “полная правиль­
ность диагноза рентгеновского сним ка была 674 из 759, или 89 процентов “
(том. 84, с. 254). Автор статьи в издании “Клиническое акушерство и гине­
кология” (Clinical Obstetrics and Gynecology) в 1966 заявил, “Аш (Asch) об­
наруж ил 90% -ую корреляцию маммографии с патологическими результа­
тами у 500 пациентов” (том. 9, с. 217). “Совпадение между рентгеновским и
патологическим диагнозом было 91.6% ” (Egan, 1972, с. 379). Все эти утвер­
ж дения подразумевают, что, если у пациента был положительный диагноз,
обследование будет правильным, и у пациента будет рак в 90% случаев. Это
не так.
Во-вторых, некоторые авторы явно допускают ош ибку. Приведем цита­
ту из вы пуска “Клиническое акушерство и гинекология”(Clinical Obstetrics
and Gynecology) 1972 года в статье “М аммография в ее перспективе”, в ко­
торой была предпринята попы тка исправить некоторую путаницу, сущ е­
ствующую в литературе: “Среди ж енщ ин, у которых подтвердилась карци­
нома груди и которым делали маммограмму, не существовало рентгеновско­
го диагноза злокачественной опухоли приблизительно для одной пациент­
ки из обследованных пяти. В таком случае, если на основе отрицательной
маммограммы, мы приходим к решению отсрочить биопсию твердого ново­
образования в груди, то, возможно, в одном случае из пяти мы отсрочиваем
биопсию злокачественной опухоли” (том. 134, с. 98). Автор неправильно ут­
верждает, что Р (отр|рак)= 0 .2 подразумевает, что Р (рак|отр)= 0 .2 . Его ошиб­
к а становится очень серьезной, когда он заклю чает, что “отсрочить биопсию
клинически доброкачественного твердого новообразования груди, которое
было показано как доброкачественное на маммографии, значит, сделать ш аг
назад в уничтож ении карциномы груди для женского населения”. Вероят­
ность того, что у такой пациентки рак, зависит от априорной вероятности,
но она меньш е чем 1 из 100. Его анализ более, чем в 20 раз ошибочен.
Ж урнал “Хирургия, гинекология и акушерство”(Surgery, Gynecology and
Obstetrics) опубликовал в 1970 (том 131, стр. 93-98) выводы другой иссле­
довательской группы , которая вы числила “корреляцию рентгеновского
диагноза с патологическим диагнозом” следующим образом. Они взяли всех
пациентов с гистологически подтвержденными диагнозами и разделили их
на три группы на основе рентгеновского диагноза - “доброкачественный”,
“карцином а” и “подозрение на карциному”. В группе с рентгеновским ди­
агнозом “доброкачественный” (“отрицательны й” в наш ей терминологии),
Вероятностные рассуждения... 293
было показано, что у 84% пациентов на самом деле обнаружились доброка­
чественные опухоли. Было такж е отмечено, что 87.5% из группы с диагно­
зом “карцинома” (или “полож ительны й”) имели подтвержденные биопси­
ей злокачественные новообразования. Таким образом, Р(рак|пол)=87.5% и
Р (доброкач|отр)=84% . Но авторы приняли эту спрогнозированную точность
за ретроспективную точность. Они заявили, что “правильны й диагноз мам-
мограммы был сделан в 84% от случаев с доброкачественными опухолями
и в 87.5% от опухолей с карциномой”. Ф актически, истинно положитель­
ная пропорция (Р (пол|рак)) в этом исследовании была равна 66% , а истин­
но отрицательная пропорция (Р (отр|доброкач)) была 54% .
В письме к редактору ж урнала “Национальный обозреватель”(National
Observer), вы пуск от 11 сентября 1976 врач представил пять “наблюдений и
ф актов” в поддержку своего мнения, что “установивш аяся практика мам­
мографии (то есть, проекционная маммография) не отвечает интересам на­
селения в целом в любом возрасте”. Вот первые наблюдения.
(1) точность экспертизы маммографии, как сообщают, между 80 и 90%, в зависимости
от таких факторов как возраст пациентки, действительно ли она имеет фиброцистичес-
кую болезнь, тип рентгеновского оборудования, опыт рентгенолога, и, каково наше
определение “точности”... Даже если мы заключаем, что точность - 85% (и я уверен,
что не каждый рентгенолог в нашей стране может достигнуть такого значения в соб­
ственной практике), то это означает, что 15% ж е н щ и н , к о т о р ы м с д е л а л и р е н т г е н , о к а ­
ж у т с я с н е п р а в и л ь н ы м и и н т е р п р е т а ц и я м и р е з у л ь т а т о в , и л и более ве р о я т н о , и х м ам -
м о гр а м м ы п р о с т о н е с м о г у т п о к а з а т ь б о л е зн ь . Э т о о з н а ч а е т , ч т о 15% ж ен щ и н лож ­
н о в н у ш а т ч у в с т в о б е зо п а с н о с т и , ес л и и м с к а ж у т , ч т о и х р е н т г е н о в с к и е с н и м к и н о р ­
м а л ь н ы , ес л и д е й с т в и т е л ь н о о н и уж е б о л ь н ы р а к о м . Трудно оценить вред, причинен­
ный этой группе, поскольку им было бы лучше не получить информацию, чем иметь
ошибочную. Если женщине сказать, что ее маммограмма нормальная, и ей не нужно
проходить анализы еще в течение года, женщина, больная раком, вполне может проиг­
норировать уплотнение в своей груди, из-за которого иначе она сразу же пошла бы к
врачу.

Существует несколько ошибок в рассуждении этого автора. Во-первых,


“точность” маммографии не может быть вы раж ена к ак единственное чис­
ло. Допустим, автор имеет в виду, что и истинно-положительные, и истин­
но-отрицательные пропорции равны 85% .
Во-вторых, эти пропорции (85% ) соблюдаются, если маммография ис­
пользуется, чтобы установить дифференциальный диагноз известных при­
знаков и симптомов. Такие опухоли крупнее, чем опухоли, которые изуча­
ют с помощью рентгена - тот случай, который описывает автор. Более ра­
зумные оценки истинно-положительных и истинно-отрицательных пропор­
ций в рентгеновских снимках - 60% и 98% соответственно.
В-третьих, даже используя 85% , мы находим несколько погрешностей в
рассуж дении. Рассмотрим второе предложение. Существуют два способа
неправильной интерпретации: (а) у пациентки может быть рак и отрица­
тельные анализы , Р(рак,отр); или (Ь) ее анализы могут быть полож итель­
294 КОВАРИАЦИЯ И КОНТРОЛЬ
ны ми, но у нее может не быть рака, Р(не рак, полож ит).2 И з элементарной
теории вероятности, мы знаем что

Р (рак, отр) = Р (отр | рак)Р(рак)

Р (отр|рак) дополняет Р (пол|рак) и поэтому равняется 0.15 в этом случае.


Мы не знаем точно Р(рак), но для совокупности прош едш их рентген, мы
вполне уверенны, что она меньше чем 0.005. То есть менее 5 из 1. 000 ж ен­
щ ин имеют безсимптомный, но обнаружимый с помощью маммограммы рак
груди.
Таким образом,

Р (рак, отр) <(0.15) от (0.005) = 0.00075

Т акж е,

Р (не рак, пол) = Р (пол!не рак)Р(не рак) > (0.15)-(0.995)= 0.14925

П олная вероятность неправильной интерпретации (то есть, Р(рак, отр) +


Р (не рак, пол)) - это сумма этих двух чисел, которая составляет 15% , к ак
утверж дает автор. Однако это не подразумевает, что “вероятнее, и х маммог­
раммы просто не смогут показать болезнь”. Р (рак, отр) = 0.00075 не боль­
ш е, чем Р (не рак|пол) = 0.14925. Она приблизительно в 200 раз меньше.
Д ругая проблема - то, что “точность” 85% не подразумевает, что “15 про­
центам ж енщ ин будет сообщаться ложное чувство безопасности, если им
скаж ут, что их рентгеновские снимки нормальны ”. Автор, каж ется, пы та­
ется оценить Р(рак|отр). Теперь по формуле Байеса,

Р(от р Iр а к )Р (р а к )
Р (рак\отр) =
P(pm p I р а к )Р (р а к ) + Р{рт р I нерак )Р(нерак )

(0.15)(0.005)
= ---------- ------ -------- ----------- =0.00089
(0.15X0.005) + (0.85)(0.995)

То есть если 1 0 .0 0 0 ж енщ ин, у которы х не обнаружено симптомов, прой­


дут рентген, и если мы используем неверную оценку точности автора, 8.4 5 8
из них покинет клинику с отрицательными диагнозами. Автор считает, что

2Р(А,В) ~ совместная вероятность того, что произойдет как событие А, так и событие В.
Вероятностные рассуждения... 295
приблизительно 1. 269 из них будет сообщено ложное чувство безопаснос­
ти. Ф актически, только приблизительно у 9 это будет так. Значение было
завыш ено приблизительно в 150 раз.

Таблица 2. Наличие рака и результаты рентгена у 1000 женщин, у кото­


рых наблюдались положительные результаты после физического осмот­
ра

Женщины, Женщины, не Общее


больные больные раком количество
раком
Женщины с
положительными
результатами 74 110 184
рентгеновского
обследования
Женщины с
отрицательными
результатами 6 810 816
рентгеновского
обследования
Общее количество 80 920 1.000

Примечание : истинно-положительная пропорция 0.92 (Р (пол|рак) = 0.92)


подразумевает, что из 80 ж енщ ин, больных раком, у 74 будут положитель­
ные результаты рентгеновского обследования, а у б — отрицательные. Из
всех ж енщ ин с положительными результатами, 74/184 больны раком или
Р (рак|пол) = 74/184 = 0.4 (то есть 40% ).
Источник: числа взяты из работы Вульфа (W olfe, 1964).
Н аконец, введение ф разы “если действительно они уже больны раком” ис­
к аж ает значение предлож ения. Ф разы “лож ное чувство безопасности” ,
“ если им сказали, что их анализы рентгена нормальны ”, и “если они уже
больны раком ” переводятся символически в Р (рак|отр, рак). Эта вероятность
равняется 1, а не 0.15.
Важность вероятности Р(рак ). В дополнение к путанице между двумя
точностями, многие авторы, каж ется, не понимают, что д л я проверки по­
стоянной ретроспективной точности, значение результатов анализов для
врача (прогнозируемая точность) зависит от начального риска рака у паци­
ентки, прошедшей маммограмму. Д аж е если допустить, что истинно-поло­
ж ительны - и истинно-отрицательные пропорции постоянны для всех ис­
следований, надлеж ащ ая интерпретация испытательных результатов - ве­
роятность того, что пациент с положительными (или отрицательными) ре­
зультатам и маммограммы болен раком - будет зависеть от распространен­
296 КОВАРИАЦИЯ И КОНТРОЛЬ
ности рака в совокупности, из которой был выбран пациент, от предвари­
тельной вероятности того, что у пациента рак. Это может быть чрезвычайно
важ но, когда мы сравниваем использование обследования в диагностичес­
кой клинике (где у ж енщ ин наблюдаются признаки и симптомы болезни
груди) с его использованием в рентгеновской клинике для ж енщ ин, у кото­
ры х нет симптомов.
Важность этого доказы вается следующим примером. П редположим, что
задача врача - сделать маммограмму ж енщ инам, у которы х “полож итель­
ны е” результаты физического обследования. Частота рака у таких ж енщ ин,
к а к было обнаруж ено в одном исследовании, бы ла приблизительно 8%
(W olfe, 1964). В одном множестве маммограмм в этой совокупности были
получены истинно-положительная пропорция - 92% и истинно-отрицатель­
н ая пропорция - 88% (W olfe, 1964). Пусть врач столкнется с пациенткой,
которая, по его мнению, репрезентативна по отношению к этой совокупнос­
ти (то есть, пусть Р(рак) = 8% ). П редположим, что он отправляет ее на мам­
мограмму и получает положительное заклю чение рентгенолога. Его реш е­
ние послать пациентку н а биопсию должно быть основано на новой вероят­
ности, что у пациентки рак. Эту вероятность можно подсчитать, и она будет
равна 40% (см. табл. 2). Разве отрицательны й результат исклю чил бы рак?
Вероятность того, что эта ж енщ ина больна раком, учиты вая отрицательный
результат рентгеновского обследования, - немного меньш е 1% . П равила
получения этой оценки показаны в табл. 2.
Теперь, предположим, что врач посылает на рентген ж енщ ину с подозре­
нием на рак, у которой нет никаких симптомов и физическое обследование
было отрицательны м. Распространенность рака, который мож ет быть об­
наруж ен маммограммой у таких ж енщ ин, - приблизительно 10% (напри­
мер, Shapiro, S trax & V enet, 1967). Д ля этого примера, пусть ретроспектив­
н ая точность рентгена, будет той ж е, то есть в этой совокупности пациентов
у нее снова будет истинно-положительная пропорция 92% и истинно-отри­
цательная пропорция (для диагноза доброкачественных опухолей) 88% .3
Л итература приводит данные только касательно ретроспективной точнос­
ти обследования у ж енщ ин, у которых рак и доброкачественные опухоли. В
одном исследовании приблизительно 60% этих ж енщ ин вообще были здо­
ровы (W olfe, 1965). Таким образом, в этом случае,

Р (рак|пол) = (Р (пол (рак) Р (рак))/


(Р (пол|рак)Р(рак) + Р (пол|доброкач)Р(доброкач)+
+ Р (пол|здорова) Р(здорова))

3Это - неверное предположение, так как “точность” изменяется по мере того, как изменяет­
ся исследуемая совокупность. Например, истинно-положительная пропорция более низкая
при использовании обследования в совокупности женщин, у которых не наблюдалось при­
знаков болезни, потому что раковые новообразования имеют тенденцию быть намного мень­
шими, и их тяжелее обнаружить. Это предположение сделано только для того, чтобы про­
демонстрировать важность Р (рак).
Вероятностные рассуждения... 297
Р(доброкач), Р(здорова) и Р(пол|здорова) не рассматриваю тся в литературе.
Это приводит нас к подозрению, что их важность в анализе этих проблем не
понята. В этом примере, мы будем использовать данные, представленные
Вульфом (W olfe, 1965) и предполагать, что Р (здорова) - приблизительно
60% , и Р(доброкач) - приблизительно 40% . Мы такж е сделаем предполо­
ж ение в пользу маммографии и позволим Р (пол|здорова) быть 0% .
П родолжая использовать этот пример, предположим, рентгенолог сооб­
щ ает, что маммограмма у данной ж енщ ины без симптомов заболевания,
полож ительна. У читывая положительный результат маммографии, веро­
ятность того, что у пациента рак (Р (рак|пол) - приблизительно 1 из 49, или
приблизительно 2.0% (табл.З). В предыдущем примере, в котором были
ж енщ ины с симптомами болезни, Р (рак|пол) была 40% . Таким образом, в
зависимости от того, кто исследуется, может существовать приблизительно
двадцатикратная разница в вероятности того, что у ж енщ ины с положи­
тельной маммограммой рак.

Таблица 3. Наличие рака и результаты рентгеновского обследования у


1000 женщин, у которых не обнаружено никаких симптомов

Ж енщ ины с Ж енщ ины с Ж енщ ины, Общее


раковы м и доброкачест- не больные коли-
новообразова- венны м и раком чество
ниями новообразовани-
______________ ям и
Женщины с
положительным
результатом 48 0 49
рентгена
Женщины с
отрицательным 352 599 951
результатом
рентгена

Общее количество 1 400 599 1.000

Примечание: истинно-положительная пропорция 0.92 подразумевает, что


рентген обнаружит рак у одной ж енщ ины , которая больна. Истинно-отри­
цательная пропорция 0.88 для доброкачественной опухоли подразумевает,
что из 400 ж енщ ин с доброкачественными новообразованиями, у 352 будет
отрицательны й анализ рентгена, в то время к ак у 48 рентген будет положи­
телен. Таким образом, у 49 ж енщ ин будет положительный рентген, но толь­
ко у одной рак, или Р (рак|пол) - 1/49 = 0.2 (то есть 2% ).
298 КОВАРИАЦИЯ И КОНТРОЛЬ
Это поднимает главный вопрос относительно медицинского рассуждения -
при попытке оценить симптомы пациента, как должен врач использовать
информацию относительно основной частоты возможных болезней в этой со­
вокупности в целом? М едики, каж ется, запутались в этой проблеме. С одной
стороны, врачи утверждают, что относительная распространенность болезни
не должна затронуть оценку вероятности того, что отдельно взяты й пациент
болен. Это понятие появляется в нескольких аксиомах, таких, к ак, “каж ды й
пациент - особый неповторимый случай” и “статистика - для мертвых”. При
обсуждении определенных проблем, эта идея иногда выражается неявно, как
в утверждении, “у молодых ж енщ ин, очевидно, меньше злокачественных
новообразований, что, однако, не должно влиять на индивидуальный случай”
(W olfe, 1967, стр. 138). Это может такж е быть утверждено в явной форме и
представлено к ак правило, которому нужно подчиняться. Например, следу­
ющее появилось в учебнике по клиническому диагнозу, когда имеется сле­
дую щ ая рекомдация: “Когда пациент консультируется со своим врачом по
поводу недиагностированной еще болезни, ни он, ни доктор не знают редкая
ли это болезнь, пока диагноз не поставлен окончательно. Статистические ме­
тоды могут применяться только к многотысячной совокупности. Редкая бо­
лезнь либо есть у человека, либо ее у него нет; возможность наличия двух бо­
лезней полностью не соответствует проблеме постановки диагноза” (DeGowin
& DeGowin, 1969, стр. 6).
С другой стороны, эти утверждения часто противоречат поведению вра­
чей, которые пытаю тся, использовать эту диагностическую информацию.
Посмотрите, какие принципы преподаются в медицинских учебных учреж ­
дениях: “Когда Вы слыш ите цокот копыт, думайте о лош адях, а не о зебрах”,
“Обычные вещ и происходят наиболее часто”, “Следуйте закону Саттона
(Sutton): идите туда, где есть деньги”, и т.д. Кажется, что многие врачи осоз­
нают ценность информации относительно предшествующей вероятности бо­
лезни, но формальные уроки теории вероятности усвоены плохо. Без формаль­
ной теории, врачи склонны совершать те ж е самые ошибки в вероятностном
рассуж дении, которы е наблю дались в других контекстах (K ahnem an и
Tversky, 1973,4; Lyon и Slovic, 1976).

Выводы: М аммограммы и биопсии


Эти проблемы могут иметь важ ны е практические последствия. Например,
в упомянуты х примерах два автора основывали свои заклю чения на непра­
вильном вероятностном рассуждении. Один неправильно утверж дал, что
ж енщ ина с опухолью в груди, которая каж ется доброкачественной при фи­
зическом обследовании и по результатам рентгеновского снимка все еще име­
ет вероятность 20% того, что у нее рак, и ей стоит порекомендовать пройти
биопсию. Другой автор основывал свои рекомендации против рентгена на
неверной оценке частоты, с которой ж енщ ины получили бы ложное чув­
ство безопасности (то есть, рак, не обнаруженный маммограммой). Оба ав­
Вероятностные рассуждения... 299
тора, возможно, приш ли бы к тому ж е заклю чению , если бы они рассужда­
ли правильно, но могли бы и не прийти.
Ценность диагностической информации. Ценность маммографии у ж ен­
щ ин, которые имеют признаки и симптомы болезни груди, леж ит в ее спо­
собности обеспечить диагностическую информацию , которая повлияет на
реш ение врача относительно биопсии. Точнее, исход обследования должен
изменить оценку вероятности того, что у пациента рак. К ак пиш ет один ав­
тор:
Маммография может помогать врачу в различении доброкачественных и злокачествен­
ных новообразований.... У некоторых новообразований, особенно небольших, может
отсутствовать достаточно характеристик, которые дают вроачу высокую степень подо­
зрения, чтобы оправдать биопсию. Именно здесь... маммограмма может обеспечивать
дополнительные объективные данные. Таким образом, в случае неопределенной опу­
холи в груди, маммография может помочь врачу в принятии решения, применять ли
биопсию (Clark & Robbins, 1965, стр. 125).

Чтобы любое диагностическое обследование было полезным, оно должно


предоставлять информацию, которая может потенциально изменить реш е­
ние о том, что делать с пациенткой - направить на биопсию тех, кого иначе
бы туда не направили, и, мы должны надеяться, не допускать биопсии у
некоторы х ж енщ ин, которые иначе были туда направлены . Это понятие
развито в статистической теории принятия решений и использовалося для
анализа некоторых медицинских проблем в исследовательских условиях *на-
пример, Lusted и др., 1977)
Многие врачи признаю т, что результаты рентгена несут полезную инфор­
мацию , которая должна помочь при общении с пациентом, но как именно
информация должна использоваться, не указы ваю т. О бъяснения, данные
большинством авторов, содержат мало определенных направлений. “Мам­
мография не предназначена для предписания лечебных процедур, но она
мож ет обеспечивать, в некоторых случаях, только ту частицу более точной
инф орм ации, которая помогает избеж ать неж елательны х последствий”
(Egan, 1972, с. 3192). “М ам м ограф ия-ценное вспомогательное средство для
хирурга при диагностировании и лечении опухолей в молочной ж елезе “
(Lyon, 1975, с. 231). “М аммография мож ет помочь в разъяснении непонят­
ны х результатов, полученных после физического осмотра” (Egan, 1969, р.
146). Она “играет поддерживающую или вспомогательную рол ь...” (Block
& R eynolds, 1974, с. 589). Точность и степень поддерж ки обычно оставлены
на усмотрение врача.
Маммограммы и биопсии: Практика. К аж ется, что роль маммографии в
таких слу гаях понята только частично. Чтобы понять это, исследуем воз­
действие, которое, как клинические исследователи предсказывают, маммог­
раф ия будет оказы вать на потребность в биопсии больной груди. В то время
к ак утверж дения, приведенные вы ш е, подразумевают, что использование
300 КОВАРИАЦИЯ И КОНТРОЛЬ
рентгена должно помочь выбрать пациентов для биопсии, равное число ут­
верж дений говорит, что маммография не мож ет, и на самом деле, не долж ­
на исполнять эту функцию . “Любая ощ утимая опухоль требует проверки
хирургическим вмеш ательством и биопсией, независимо от результатов
рентгена” (Lesnick, 1966, стр. 2007). “В то время к ак результаты маммогра­
фии обычно однозначны, она не может заменить биопсию” (Egan, 1969, с.
148). “Никоим образом эта процедура не должна умалять важность биопсии.
Ф актически, использование установившейся практики маммографии вновь
подтверждает важ ность биопсии, так к ак результаты рентгена, говорящ ие
о злокачественном новообразовании, требуют биопсии для подтверж де­
н и я .... Это никоим образом не умаляет важность биопсии.... Биопсия так
ж е необходима для подтверждения результатов рентгена, к ак и для подтвер­
ж дения ф изических симптомов” (Gershon-Cohen, и B orden, 1964, с. 2753,
2754). “Очевидно, что маммография не может заменить хирургию ” (DeLuca,
1974, с. 318). “Позвольте нам реш ительно заявить, что маммография - не
замена биопсии” (McClow и W illiam s, 1973, с. 618).
Одно из наиболее точных стратегических утверждений политики того,
к ак маммография долж на использоваться для выбора пациентов для био­
псии, появилось в ж урнале “Архивы хирургии”в 1966 (Archives of Surgvery
том 93, с.853-856). Тщательное исследование различны х направлений по­
казы вает, что используется только половина потенциала этой диагности­
ческой процедуры. Схема использования маммографии, “ для того чтобы
назначить лечение или установить, что делать с пациентом дальш е” вклю ­
чает три категории пациентов:
Категория А: “пациентки с ‘уплотнением’ или ‘доминирующей опухо­
лью ’ в груди - прежде всего хирургическая проблема и не должно быть ни­
какой задерж ки для прохождения биопсии. М аммография, в этом случае,
является строго дополнительным средством .... Она может показать скры ­
тые опухоли” (стр. 854).
Категория В: “у пациенток наблюдаются симптомы, имеющие отнош е­
ние к молочной ж елезе, но никакого различимого уплотнения или ‘домини­
рующ ей опухоли’ н е т .... В этой категории, хирург и врач получит больше
всего сведений от маммографии, потому что существует подтверждающая
модальность”. Здесь маммограмма даст подтверждение и поддержку, “если
впечатление от клинического осмотра — что опухоль доброкачественная.
Однако она не долж на изменить предшествующее мнение касательно био­
псии” (с. 855).
Категория С: у пациенток отсутствуют признаки или симптомы, отсут­
ствуют клинические признаки для биопсии, и маммограмма может только
увеличивать количество биопсий.
Таким образом, автор выделил план, который сводит к нулю ценность
маммографической информации в отборе пациентов, у которых биопсии
можно избеж ать. И спользуется только та часть информации, где подразу­
Вероятностные рассуждения... 301
мевается биопсия. И нформация, которая могла бы воспрепятствовать про­
хождению биопсии, игнорируется.
Маммограммы и биопсии: Потенциал. Чтобы оценить, как проблемы в ве­
роятностном рассуждении могут затрагивать процесс медицинского обслу­
ж и вания, давайте исследуем роль, которую маммография могла бы играть
в дифференциальном диагнозе и в выборе пациентов для биопсии. К ак опи­
сано выш е, цель процедуры - изменить субъективную оценку человека, при­
нимаю щ его реш ения, относительно вероятности того, что у пациента рак.
Если эта вероятность достаточно вы сока (как определено врачом и пациен­
том), рекомендуется биопсия. Назовем эту вероятность, порогом биопсии.11
Теперь рассмотрим влияние процедуры н а управление двумя группами п а­
циентов.
П ервая группа состоит из тех пациенток которые, на основе истории бо­
лезни и физического осмотра, как думают врачи, больны раком. Используя
данные, опубликованные Фридманом (Friedm an, 1966), пусть предшествую­
щ ая вероятность (частота) рака в этой группе, будет 90% . Если бы маммог-
рамма была выполнена у такого пациента, положительный результат увели­
чил бы вероятность рака (Р (рак|пол)), возможно, до 95% . Отрицательный
результат маммограммы все ещ е оставил бы для пациента вероятность нали­
чи я рака 71% . Эта вы сокая вероятность побуждает такие утверждения как:
“Если субъективное впечатление врача дает достаточно причин для подозре­
н ия на рак, врач будет вынужден прибегнуть к биопсии” (Clark и др., 1965, с.
133). Вероятность злокачественности 71 % - все еще достаточно вы сокая ве­
роятность для того, что почти каж ды й захотел бы пройти биопсию.
Теперь рассмотрим вторую группу пациентов, у которых имеется опу­
холь, злокачественность которой не очевидна. В одном исследовании веро­
ятность, что такая опухоль является злокачественной, была 14% (Friedm an
и др., 1966). При отсутствии дальнейш ей информации, клиника проводит
биопсию новообразования: “Если опухоль развивается, она долж на быть
удалена и тщ ательно исследована” (del R egato, 1970, с. 861). При исполь­
зовании этой установки, давайте предполож им, что порог биопсии паци­
ента - 10% . То есть если, по предположению врача, вероятность, что у его
пациента рак выш е 10% , тогда пациент и врач соглаш аю тся, что биопсия
долж на быть проведена.4 5И спользуя порог биопсии 10% , мы можем опреде­

4Любой, кто хочет убедиться в существовании порога биопсии может рассуждать, следую­
щим образом. Вы согласны, что никто не захочет проходить биопсию, если вероятность рака -
1 из 30 триллионов? И мы можем согласиться, что фактически каждый хочет подтвердить
диагноз и пройти лечение, если эта вероятность - 98 из 100? Если это так, то где-то между 1
из 30 триллионов и 98 из 100 у человека находится порог биопсии. Конечно, если женщина
отказывается от биопсии и лечения даже, если вероятность рака велика, тогда у нее нет
такого порога.

5Порог биопсии - очень интересное и важное число. Его изменение оказывает большое вли­
яние на количество женщин, подвергающихся биопсии, частоту непродуктивных биопсий,
стоимость лечения пациента, а также прогноз о пациенте. Из-за рискованности, а также
302 КОВАРИАЦИЯ И КОНТРОЛЬ
лить влияние маммограммы на руководство 1,000 таких пациентов. Без об­
следования, все пациентки должны были бы пройти биопсию, причем 860
из них — непродуктивную. П риблизительная судьба изначальны х 1.000 па­
циенток с новообразованием, при использовании мамограммы, представле­
на на Рисунке I .6

потому, что, они принимают решение за другого человека, врачи, устанавливает порог био­
псии весьма низко. Утверждение “если есть хоть какая-то вероятность, что опухоль злока­
чественна, биопсия должна быть сделана” является типичным. “Если врач полностью не
уверен, что новообразование доброкачественно, оно должно быть подвергнуто биопсии без
промедления” (Allen, 1965, с. 640). Согласно полученным сведениям, сами женщины вооб­
ще устанавливают порог выше, чем врачи, хотя бывает и наоборот.
Например, мы можем исследовать данные, взятые из большого клинического испытания, в
котором использовались маммография и физическое обследование молочной железы, что­
бы выявить рак у женщин, у которых не наблюдалось никаких симптомов. (Shapiro, Strax
и Venet, 1971). В зависимости от того, как было обнаружено новообразование в молочной
железе (т. е. с помощью какой процедуры или комбинации процедур), вероятность того, что
болезнь молочной железы у женщины — рак, варьировалась от 15 до 54%. На основе поло­
жительного физического обследования, врачи порекомендовали 545 женщинам с отрица­
тельными результатами маммограммы пройти биопсию. Несмотря нато, что частота рака в
этой группе составляла 15% ,31% женщин отказался проходить биопсию. Частота рака у
женщин, результаты физического обследования которых были отрицательными, а мам-
мограммы - положительными равна 20%, но 29% таких женщин отказались проходить биопсию.
У женщин с положительными результатами, как физического обследования, так и мам­
мограммы вероятность рака 54%, но 5% женщин предпочли не проходить биопсию в реко­
мендованное время. Таким образом, из этой предварительной информации следует, что у
более чем 31% женщин порог биопсии выше 15%, у 29% женщин порог биопсии выше 20%,
а у 5% женщин порог биопсии превышает 54%.

6 Чтобы показать воздействие маммограммы на этих пациенток (а также пациентов с дру­


гими признаками и симптомами) необходимо большое количество информации, которая
непосредственно недоступна в литературе. К счастью, в одном исследовании (Friedman и
др., 1966) данные относительно частоты рака и ретроспективной точности маммографии
представлены отдельно для трех групп пациенток- с очевидной карциномой, новообразо­
ваниями и пациенток с другими симптомами болезней молочной железы. Опубликованные
данные, однако, неполны, и данные относительно частоты сомнительного рентгеновского
диагноза доброкачественных и раковых опухолей не включены. Использовались данные,
предоставленные в исследовании Фридмана, и для этого примера, были сделаны следую­
щие предположения: (1) опухоли, не подвергнутые биопсии, были на самом деле доброка­
чественными, (2) опухоли, не подвергнутые биопсии, были закодированы как отрицатель­
ные, (3) половина доброкачественных новообразований, которые не были закодированы как
отрицательные, были закодированы как положительные (другая половина была закодиро­
вана как неопределенная), и (4) половина злокачественных новообразований, которые не
были закодированы как положительные, были закодированы как отрицательные. Первые
два предположения - наиболее оптимистическая интерпретация точности маммографии.
Третье и четвертое предположения очень важны, и по мере того, как ложно-положительная
(или ложно-отрицательная) пропорция стремится к нулю, мощность положительного (от­
рицательного) результата рентгеновского обследования, включающее!исключающее) рак,
растет. Аналогично, по мере того, как ложно-положительные или ложно-отрицательные
пропорции растут, обследование теряет свою прогнозирующую мощность. Интерпретация
данных Фридмана даже усложнилась при представлении ее в терминах молочных желез, а
не пациенток. Тем не менее, существует много информации в этом сообщении, и разумно
использовать ее в этом примере, при условии, что читатель понимает, что это - иллюстра-
Вероятностные рассуждения... 303
П ациенты с положительным результатом маммограммы имеют 53% ве­
роятности наличия рака и, так как мы предположили, что они имеют порог
биопсии 10% , они должны были бы пройти биопсию. П оскольку вероят­
ность того, что пациентка с сомнительной маммограммой больна раком равна
34% , эти пациенты такж е должны пройти биопсию. Пациенты с отрица­
тельным результатом маммограммы имеют вероятость 4% наличия рака,
и, так к ак это ниж е их принятого порога биопсии (10% ), они не хотели бы
подвергнуться биопсии, но предпочтут тщ ательное наблюдение. Общее ко­
личество немедленных биопсий было уменьшено от 1 .0 0 0 до 240. По край ­
ней мере, еще 30 биопсий будут сделаны в конечном счете, потому что 30 из
760 оставш ихся пациенток больны раком.
Таким образом, ож идаемая польза от наличия мамограммы (например,
сокращ ения вероятности ненужной биопсии от приблизительно 86% до не­
много более 13% ) может быть сравнена с затратами (например, опасностью
пораж ения лучевой болезнью и приблизительно $ 75), и небольшим умень­
ш ением в ожидаемом вы ж ивании (сущ ествует 3% вероятность того, что
диагноз злокачественного новообразования будет отлож ен на месяц или
около того). Если использовалось понятие порога биопсии и некоторая про­
стая теория вероятности, многим пациентам в этой группе, у которых был
отрицательны й результат маммограмы, не будет сделана биопсия. П ри от­
сутствии этого типа анализа существует “согласие между хирургами, что
все пациенты (в этой группе) должны пройти биопсию, независимо от ре­
зультатов маммограммы” (F riedm ann др., 1966, с. 889)
Положительные 140 Рак 74
новообразования 0,53
0,14
Нет рака вв
0,47

1,000 Неопределенные Рак 34


пациентов новообразования 100 0,34
ОдО
Нет рака вв
0,6в

Отрицательные Рак
новообразования 0,04
760
0,76 Нет рака 780
ТЩГ

Рис. 1. Вероятность рака у ж енщ ин с доминирующими новообразова­


ниями

ция, а не формальный анализ. Формальный анализ этих вопросов требовал бы лучших дан­
ных. Значения для точности, используемой в тексте для оценки пациентов в группе 2 сле­
дующие: Р(пол|рак)= 0.52, Р(неопр|рак) =0.24, Р(отр|рак) = 0.24, Р(пол| доброкач) = 0.075,
Р (неопр|доброкач) = 0.075, и Р (отр|доброкач) = 0.85.
304 КОВАРИАЦИЯ И КОНТРОЛЬ
Важность порога биопсии в этом примере должна быть подчеркнута. Если
врач и его пациент установили порог в 1% - то есть, если бы пациент чувство­
вал, что вероятность 1 из 100 наличия рака достаточна, чтобы применить био­
псию - тогда отрицательный результат мамограммы не устранил бы потреб­
ность в биопсии (вероятность рака 4% превысит этот порог). М амограмма,
возможно, дала бы клиницисту некоторую информацию, но эта информация
не повлияла бы на решение о биопсии. Использование мамографии в этом
случае должно было бы быть оправдано на других основаниях.
Пересмотр практики. Этот тип анализа помогает прояснить потенциаль­
ную полезность маммографии при постановке дифференциального диагно­
за различны х опухолей. Это такж е помогает нам оценить следующие утвер­
ж дения:
1. “М аммография оказывает мало влияния на решение относительно кли ­
нически (т.е. физически) ощутимой опухоли молочной ж елезы , которая, на
основе своих собственных характеристик, требует биопсии “ (из Archives of
Surgery, 1974, том. 108, стр. 589). В обследовании пациентов с новообразо­
ваниям и, биопсия требовалась только на одних лиш ь клинических основа­
н иях. И спользование маммографии разбивает группу на подгруппы с час­
тотами рака в пределах от 53% до 4% . Биопсии можно было бы избеж ать в
последней группе, и количество биопсий могло бы быть уменьшено на 73%
(от 1. 000 из 1. 000 до 270 из 1.000).
2. “Д ля клинических целей маммография долж на обеспечить приблизи­
тельно 100 процентный уровень точности прежде, чем она одна мож ет опре­
делять лечение” (ш Archives of Surgery, 1 9 7 4 ,том 1 0 8 ,с. 589). В совокупно­
сти, подобной второй группе, которая обсуждалась выш е, могло бы быть
весьма рационально позволить маммографии определять пациентов для
биопсии. Вспомним, что истинно-положительная пропорция, используемая
в том примере, бы ла 52% , и что более точное испытание будет даже более
ценно.
3. “М аммография - не замена биопсии” (из Oncology, 1969, том 23, с. 148).
Ц ель и маммографии, и биопсии состоит в том, чтобы обеспечить информа­
цию относительно состояния пациента. Некоторые пациенты , при отсут­
ствии маммографии, требуют биопсии. У некоторых из этих пациентов от­
рицательный результат маммограммы устранил бы необходимость биопсию,
и в этих случаях, маммограмма заменяет биопсию.
4. “Каждому решению о прохождении биопсии долж на предш ествовать
маммограмма” (из Oncology, 1969, том 23, с. 146). Рассмотрим клинически
очевидную карциному. Вероятность рака будет превы ш ать порог биопсии
каж дого, почти независимо от того, каков результат маммограммы. Пер­
вичное оправдание этой политики, в таком случае, должно леж ать в вероят­
ности того, что клинически очевидная опухоль является доброкачествен­
ной (иначе пациентка бы ла бы должна пройти мастектомию (удаление мо­
лочной ж елезы ), и что имеется скрытое неощутимое злокачественное ново­
Вероятностные рассуждения... 305
образование. Вероятность этого сложного события равна суме вероятностей
двух событий, которые являю тся чрезвычайно маленькими (приблизитель­
но 1 из 5.000).
5. “Отсрочить, биопсию клинически доброкачественного новообразова­
н ия груди, которое было определено доброкачественным на маммографии,
значит, сделать ш аг назад в уничтожении карциномы груди” (из Surgery,
Cynecology and Obstetrics, 1972, том 134, с. 98). Пусть “клиническая добро­
качественность” будет представлена Р (рак) - 5% . После отрицательного
результата маммограммы, вероятность, что такой пациент имеет рак - при­
близительно 1 % . И з 100 биопсий, 99 были бы непродуктивны. Я вляется ли
отказ от биопсии здесь ш агом назад или вперед? Другой момент - то, что,
если бы этой стратегии следовали, все новообразования, начиная от “кл и ­
нически доброкачественных” и заканчивая клинически очевидными кар­
циномами, требовали бы биопсии, независимо от того, каков был исход об­
следования. Это, каж ется, противоречит утверждению автора, что “когда
используется в своем надлеж ащ ем виде, маммография является превосход­
ным дополнением для врача в лечении карцином ы груди” (из Surgery,
Cynecology and Obstetrics, 1972, том 134, с. 98).
6. “М аммография никогда не долж на использоваться вместо биопсии,
когда мы имеем дело с ‘доминирующим новообразованием’ в груди, и ни­
когда не долж на изменить основной хирургический подход в болезнях гру­
ди, то есть, ‘опухоль - это опухоль’ и oi а долж на быть подвергнута биопсии
либо путем разреза, либо путем аспирации” {аз Archives of Surgery, 1966,
том 93, стр. 854). П ациентки с доминирую щими новообразованиями и по­
рогами биопсии выш е чем 5% не согласились бы с этим утверждением.
7. “В сомнительных случаях полагаться на маммограмму ошибочно. Она
необходима после обследования и прощ упы вания молочной ж елезы , чтобы
реш ить, будете Вы или нет делать биопсию, если рентген не доступен. Если
Вы реш или проводить биопсию - проводите ее. Если Вы уверены, что нет
н икаких симптомов для хирургического вмеш ательства или физического
обследования, направьте пациентку н а маммограмму. К ак только врач го­
ворит к себе, и особенно, если он говорит пациентке, “Я не совсем уверен,
давайте пройдем рентген”, он подсознательно полагается на отрицательный
результат маммограммы, когда нужно рассчитывать только на положитель­
ны й. Это - психологическая ловуш ка, в которую все мы склонны попадать,
и которая намного серьезней, чем некоторое количество ложно-положитель­
ны х диагнозов, достигнутых при помощи маммографии” (R hoads, 1969, с.
1182). Ни одной биопсии не удастся избежать, применяя эту стратегию. Это -
позор, ведь сам автор выш еупомянутого утверж дения говорит, что, “суще­
ствует мало областей, в которых требуется так много хирургии, которой
можно было бы избеж ать лучш ими методами диагноза, чем в области болез­
ней молочной ж елезы ”.
306 КОВАРИАЦИЯ И КОНТРОЛЬ
Мы теперь готовы оценить следующую историю, которая появилась в
“Хрониках” в Сан-Ф ранциско (K ushner, 1976). У женщ ины-репортера не­
давно обнаружили опухоль в молочной ж елезе, и она описывает консульта­
цию с врачом.
“ Я хотел бы, чтобы Вы прошли ксеромаммограмму. Это новый способ делать
маммограммы - снимки молочной ж елезы .”
“А она дает точные результаты?”
Он пожал плечами, “Вероятно, столь ж е точные, как любой снимок. Вы
знаете, - предупредил он, - “даж е, если результат отрицателен - что означает,
не злокачественное новообразование - единственный способ убедиться в этом
состоит в том, чтобы вырезать опухоль и рассмотреть ее под микроскопом”.
Ж енщ ина обсудила эту проблему со своим мужем.
“Что сказал доктор?”
“Он хочет сделать ксеромаммограмму. Тогда, независимо от результата,
опухоль нужно будет вырезать”.
“Так, зачем сначала нужно делать рентген?”
“Я думаю, потому, что так надо. И наш доктор говорит, что обследование
дает правильные результаты приблизительно в 85% случаев.... Так, сначала
я записалась на термограмму - она будет либо положительная, либо отрица­
тельная, и если этот результат совпадает со снимками ксеромаммограммы,
то статистика говорит, что диагноз был бы на 95% надежный”.

Подводя итоги, казалось бы разумно спросить, что, если цель маммографии


состоит в том, чтобы помочь врачам отличить доброкачественную от злока-
чествнной опухоли молочной ж елезы , таким образом не допуская некото­
ры х пациентов на такую более обширную и травмирующую процедуру как
биопсия, тогда мы должны позволить обследованию выполнить эту ф унк­
цию . Если с другой стороны, врач всегда должен придерж иваться предш е­
ствующего реш ения о биопсии, и на него не влияет исход маммограммы,
мы не долж ны настаивать на том, что цель этого обследования состоит -
помочь отличить доброкачественную опухоль от злокачественной, так к ак
этот вывод будет сделан окончательно исходя из результатов биопсии. Н а­
конец, если цель обследования состоит в том, чтобы искать скры ты й и к л и ­
нически неподозреваемый рак в другой области молочной ж елезы (далеко
от прощ упанной опухоли, которая нуж дается в биопсии так или иначе), мы
долж ны признать, что вероятность такого события чрезвычайно мала и что
использование этого вида обследования равно использованию рентгена.
Моя цель не состоит в том, чтобы приводить доводы в пользу политики
маммографии или биопсии - чтобы так поступать, нуж ны более качествен­
ные данные и лучш ая оценка ценностей пациентов. Я только хочу предпо­
лож ить, что мы не развили формального способа вероятностного рассужде­
н ия относительно этого типа проблемы, что клинические оценки могут быть
неверными, и что текущ ая клиническая стратегия может быть непоследо­
вательна или неправильна.
Вероятностные рассуждения... 307

Обсуждение
Эти примеры были представлены, чтобы проиллюстрировать сложность при­
няти я реш ения в медицине и продемонстрировать, к ак некоторые врачи уп­
равляю т одним иэ аспектов этой сложности - вероятностями. Случай, кото­
рый мы исследовали - относительно простой, использование единственно­
го диагностического обследования для распределения опухолей на две груп­
пы злокачественные и доброкачественные. Б аза данных для этой проблемы
относительно хорош а. Точность и диагностическая ценность процедуры
были исследованы и проанализированы во многих учреж дениях в течение
многих лет. К ак вы разился один исследователь, “я не знаю ни о какой дру­
гой медицинской процедуре, которая была бы больше проверена и перепро­
верена, чем маммография” (Egan, 1971, с. 1555).
Вероятностные методы, обсужденные в этой главе, были известны в те­
чение столетий. В последних двух десятилетиях они применялись все боль­
ш е и больш е для медицинских проблем (например, L usted, 1968), и исполь­
зование систематических методов для управления неопределенностью воз­
растало в учебных планах медицинских факультетов, статьях ж урналов и
образовательных программах для аспирантов. В настоящ ее время, однако,
применение этих методов было спорадическим и еще не отфильтровалось,
чтобы затронуть мыш ление больш инства практикую щ их врачей. К ак про­
иллю стрировано в этом социологическом исследовании, медицинские про­
блемы слож ны , и сила формального вероятностного рассуж дения обеспе­
чивает большие возможности для улучш ения качества и эффективности
медицинского обслуживания.
19. Получение знаний из опыта и условно -
оптимальных правил при принятии решения*

Хиллел Дж. Айнхорн

Текущ ая работа в исследовании принятия реш ения ясно изменила направ­


ление от описания процессов выбора с помощью нормативных моделей (и
их модификации) к постановке акцента на эвристических процессах, раз­
виты х в пределах общей структуры когнитивной психологии и теорий об­
работки инф орм ации (P ayne, 1980; R usso, 1977; Sim on, 1978; Slovic,
F ischhoff & L ichnenstein, 1977; Tversky & K ahnem an 1 9 7 4 ,1 ,1 9 8 0 ). Пере­
мещ ение вним ания от вопросов, насколько хорошо люди действуют к тому,
к ак они действуют, безусловно, важ но (например, H ogarth, 1975). Однако,
полезность изучения двух вопросов одновременно нигде так не очевидна,
к ак в исследовании эвристических правил и стратегий. П ричина для этого -
то, что сравнение эвристических и нормативных правил позволяет исследо­
вать несоответствия между ф актическим и оптимальным поведением, ко­
торое поднимает вопросы, почему такие несоответствия существуют. В этой
главе, я концентрирую внимание на том, к ак человек формирует оба типа
правил из своего опыта. Интерес к изучению с помощью экспериментов ста­
вит множество проблем, которым не было уделено достаточно внимания;
например, при каки х условиях изучаю тся эвристики? К ак они проверяю т­
ся и поддерживаю тся в данном эксперименте? При каки х условиях мы не
сможем узнать о предубеж дениях, которые могут следовать из их использо­
вания?
Важность изучения для понимания эвристик и выбора поведения может
бы ть обнаруж ена, приним ая во внимание следующее:

*Это - сокращенная версия книги, которая появилась в редакции Т. S. W allsten. Когнитив­


ные процессы при поведении выбора и принятии решений. Hillsdale, N. J.rLawrence Eribaum
Assoc., Inc. Переиздано в соответствии с разрешением.
Это исследование было поддержано грантом от Отделения психического здоровья и задер­
жек в развитии штата Иллинойс, Исследования и Развитие № 740-02. Я хотел бы поблаго­
дарить Робина Хогарта за его комментарии по поводу более ранней версии этой книги.
Получение знаний из опыта... 309
1. Способность делать прогноз о том, в каких условиях будет использоваться
отдельное правило, в настоящ ее время неадекватна (W allsten, 1980). Однако
интерес к тому, к ак и при каких условиях правило усваивается, должен уве­
личить способность человека делать прогноз того, когда оно, используется.
Например, если правило усвоено в ситуациях, где дано мало времени на то,
чтобы сделать выбор, прогнозирование использования такого правила уве­
личено знанием о давлении времени, используемом в задании.
2. Сопутствующее обстоятельство (1) - это то, что должно возможно вли­
ять на то, к ак люди делают оценки и принимаю т реш ения, разрабаты вая
ситуации, в которы х задачи вклю чаю т или подобны начальным условиям
изучения. Значение этого к ак для помощи, так и для управления людьми,
огромно (F ischhoff, Slovic и L ichtenstein, 1978; 1980).
3. И зучение сосредотачивается на переменны х окруж аю щ ей среды и
структуре задачи. Поэтому, переменные, такие как количество подкрепле­
ний, план подкрепления, количество испытаний (= колличество проб), и т.д .,
долж ны рассматриваться применительно к пониманию способов оценива­
ния и принятия реш ений (см. E stes, 197б). Х отя важность задачи для пони­
м ания поведения непрерывно подчеркивалась (B runsw ik, 1943; C astellan,
1977; Cronbach, 1975; Dawes, 1975b; W .E dw ards, 1971; E inhorn & H ogarth,
1978; Sim on & Newell, 1971), психологи, по-видимому, так ж е склонны к
тому, что Росс (Ross, 1977) назы вает фундаментальной ошибкой атрибуции,
как и все люди (недооценка факторов окружаю щ ей среды при приписыва­
нии причин).
4. Главная переменная в понимании эвристик - обратная связь исхода.
Так к ак обратная связь исхода - главны й источник информации для оцен­
ки качества наш их правил принятия решений /оценивания, знание того, как
переменные задачи влияю т к ак на исходы, так и на способ, которым резуль­
таты закодированы и хранятся в пам яти, становится чрезвычайно важ ны м
в объяснении того, к ак эвристика изучается и используется.
5. Область изучения представляет собой фокусную точку для рассмотре­
ния относительных достоинств психологических, а не практических объяс­
нений поведения выбора. Некоторые экономисты спорили, что, хотя чело­
век не действует “рационально” все время, он осваивает оптимальное пра­
вило посредством взаимодействия с окружаю щ ей средой. В поддержку это­
го аргумента предоставляю тся неопределенные утверж дения относительно
равновесия, эффективности и эволюционных концепций. Поэтому, иссле­
дование, к ак (и насколько хорошо) люди учатся из своего опыта, важ но в
освещ ении относительных достоинств психологических и практических
теорий выбора.

П о л у ч ен и е зн а н и й и з о п ы та: К ак ?
Очевидно, что принятие реш ения ориентировано на действие; каж ды й дол­
ж ен вы брать, какое действие соверш ить, чтобы удовлетворить основные
310 КОВАРИАЦИЯ И КОНТРОЛЬ
потребности и нуж ды . Поэтому, для любого организма важ но изучить сте­
пень, в которой действия будут вести к ж елательны м или нежелательным
результатам. Это означает, что получение знаний из опыта, главны м обра­
зом, должно вклю чать в себя изучение связей действие-исход. Кроме того,
так к ак действия и исходы следуют друг за другом, люди склонны видеть
связи меж ду ним и к а к вы раж ение причинно-следственны х отнош ений
(M ichotte, 1963). Поэтому, сильная тенденция видеть причинные отнош е­
н ия может рассматриваться к ак следствие потребности принимать меры для
удовлетворения основных потребностей. Кроме того, к ак показали Канеман
и Тверски (K ahnem an и Tversky, 1979b), изучение причинных отношений и
организация событий в причинные “схемы” позволяет людям достигать свя­
занной интерпретации их опыта. Наконец, изучение связей действие-исход
важ но для понимания того, к ак люди изучают собственные вкусы или по­
требности. Например, рассмотрим ребенка, который выбирает некий овощ,
ест его, испытывает неприятный вкус, и , таким образом, учится связывать
отрицательную полезность с этим продуктом. Обратите внимание, что имен­
но путем выбора испытываются последствия и усваивается полезность. По­
этому, усвоение связей действие-исход и усвоение полезности тесно связано.
Х отя мы получаем знания из опы та, предпринимая действие, к ак чело­
век первоначально учится выбору альтернатив? Несомненно, больш ая часть
первоначального изучения происходит методом проб и ошибок; то есть люди
беспорядочно делают выбор и наблюдают исходы (ср. Campbell, 1960). Про­
цесс, с помощью которого обучение путем проб и ошибок ведет к развитиюм
стратегий или правил, не известен (cp. Siegler, 1979). Однако можно пред­
полож ить, что и подкрепления из эмпирического опы та, и обобщения (как
по стимулам, так и по реакциям) играю т важную роль (Staddon и Sim melhag,
1971). В любом случае, правила, которые мы разрабатываем, каж ется, не­
посредственно связаны с получением знаний того, какие исходы будут вы ­
текать из определенных действий. К ак описано выш е, получение знаний из
опы та в основном индуктивно по характеру, то есть человек попадает в не­
которые ситуации или случаи, и разрабаты вает эвристику, чтобы обеспе­
чить некоторый общий способ справиться с ними. И ндуктивный характер
получения знаний из опы та имеет несколько значений относительно эврис­
тики:
1. Специфика правил. Если получение знаний происходит индуктивно с
помощью определенных случаев, то эвристические правила должны силь­
но зависеть от контекста. Большое количество сведений говорит о том, что
это действительно так (G rether и P lo tt, 1979, L ichtenstein и Slovic, 1971;
Sim on и H ayes, 1976; Tversky и K ahnem an 1980). Способ, которым проблема
сформулирована или показана, или ож идается определенная реакция, все
это, каж ется, имеет огромное значение для того, к ак обрабатывается инфор­
м ация и порождаю тся ответы. Я ркий пример этой специфики можно обна­
руж ить в работе Саймона и Хайеса (Simon & Hayes, 1976), посвященной “про­
блемным изоморфам” (problem isom orphe). Они показали, что различны е
Получение знаний из опыта... 311
поверхностные формулировки идентичных по структуре проблем (то есть,
проблем, которые могут быть реш ены, используя идентичные принципы)
сильно изменяю т то, к ак люди представляю т проблему в пам яти и , следова­
тельно, реш аю т ее. Важное значение этого результата заклю чается в следу­
ющем: чтобы сделать эвристические модели более прогнозирую щ ими, че­
ловек долж ен столкнуться с задачей, к ак она была ему предоставлена, и не
обязательно с ее структурой, к ак видит ее экспериментатор. Особенно яр ­
ким примером важности этого явления при прогнозировании поведения яв­
ляется наблюдение, что поведение зависит от того, представлено ли сокра­
щ ение налогов к ак выгода или к а к меньш ий убыток (K ahnem an и Tversky,
1979b).
2. Общность правил. Если эвристики - это правила, изученные с помо­
щью индукции, необходимо сгруппировать задачи по подобию, иначе было
бы столько правил, сколько и ситуаций. Так к ак последняя возможность
недопустима, эвристика долж на иметь некоторую общность по задачам. Од­
нако это заклю чение противоречит тому, что было сказано выш е относи­
тельно зависимости от контекста и специфичности правил. Этот парадокс
мож ет быть реш ен, если рассмотреть диапазон задач, к которым правило
мож ет прим еняться. Н апример, рассмотрим правило “Н икогда не заказы ­
вайте рыбу в ресторане, специализирую щ емся на м ясе.” В то время к ак та­
кое правило является общим относительно некоторого типа ресторанов, оно,
безусловно, более определенно, чем правило “О ценивайте вероятность, с
которой событие В происходит из процесса А их степенью подобия” (Tversky
и K ahnem an, 1974,1). Очевидно, последняя эвристика имеет намного более
вы сокий уровень общности. Ф актически, эвристики, такие к ак репрезента­
тивность, доступность, привязка, и регулировка - “метаэвристики,” то есть
они - правила о том, к ак производить правила. Поэтому, когда человек стал­
кивается с задачам и, с которыми он не встречался прежде (подобно оценке
вероятности событий), или задачам, специф ика которых заставляет их к а ­
заться новыми, метаэвристика определяет способ, с помощью которого оп­
ределенные правила могут быть сформулированы для реш ения проблемы.
И дея о метаэвристиках позволяет сохранить общность, которую любое пра­
вило обязательно подразумевает, и в то ж е время учитывает важ ны е эффек­
ты контекста, формулировки, способа ответа, и так далее. Чтобы проиллю­
стрировать это, рассмотрим исследование Словика, Ф ишхоффа и Л ихтен­
ш тейна (Slovic, Fischhoff и L ichtenstein, 1976; см. такж е Главу 33), в кото­
ром людей просили оценить относительные вероятности смерти от необыч­
ны х причин. Например, что более вероятно: быть убитым молнией или уме­
реть от эмфиземы*? Когда люди сталкиваю тся с таким вопросом, сущ еству­
ет много способов попы таться ответить. Одно из правил, которое могло бы
использоваться, гласит: “Вспомнить знакомы х мне людей, которые умерли
от двух причин, и выбрать ту, из-за которой умерло больше людей”. В моем
*Эмфизема - заболевание легких ( п рим , р е д а к т о р а ) .
312 КОВАРИАЦИЯ И КОНТРОЛЬ
собственном случае, я выбрал бы эмфизему (что имеет более высокую веро­
ятность, хотя большинство людей выбирает удар молнии). Однако, я мог бы
такж е легко разработать правило, которое приведет к противоположному
ответу; например, “Вспомнить о всех случаях смерти от удара молнии и от
эмфиземы, о которы х я когда-либо слышал (газеты , телевидение, и т.д .)”.
Если бы это было моим правилом, я выбрал бы удар молнии к ак более веро­
ятны й. Обратите внимание, что в обоих случаях я использовал эвристику
доступности. Ясно, что способ, которым вопрос был сформулирован, мог сти­
мулировать определенные правила, что привело бы к различны м результа­
там, и все ж е эти определенные правила могли бы быть систематизированы
под отдельную , более общую стратегию или метаэвристику (такж е см .,
E inhorn, K leinm untz и K leinm untz, 1979).
3. Сила эвристики. Если эвристика усваивается индуктивно, то усвое­
ние происходит в течение многих испы таний с многократным закреплени­
ем. Мы увидим, благодаря способу, которым осуществляется обратная связь,
и благодаря методам, которые мы используем, для проверки правила опы­
том, положительное закрепление может происходить даж е для неправиль­
ны х правил (W ason, I960). Кроме того, в дополнение к большому количе­
ству закрепления, которое мы испы ты ваем, размер или интенсивность зак­
репления мож ет быть такж е большим. Например, получая значительную
сумму денег после использования некоторого правила в выборе акций, мы
долж ны испы ты вать значительны й эффект закрепления. Поэтому, в отли­
чие от лабораторных исследований процессов обучения, где этические сооб­
раж ения предотвращ аю т получение большого положительного и отрица­
тельного подкрепления, наш собственный опыт не ставит никаких подоб­
ны х ограничений.

П о л у ч ен и е зн а н и й и з о п ы та: Н а с к о л ь к о хорош о?
Вопрос, насколько хорошо мы получаем знания из опыта, переклю чает вни­
м ание на сравнение эвристических правил с оптимальны ми правилам и.
Поэтому, возникает вопрос, к ак последние изучаю тся и каковы их значе­
н ия для применения в наш ем собственном опыте? Оптимальные правила,
такие к ак теорема Байеса, оптимизация, и т.д ., изучаю тся дедуктивным
путем. Ф актически, многое из того, что мож ет назы ваться формальным
изучением, имеет дедуктивный характер, то есть нам преподают научные
законы , логические принципы , математические и статистические прави­
л а, и т.д. Такие правила по своей природе очень абстрактны и не зависят от
контекста. Кроме того, когда контекст может влиять на форму правила, нам
часто говорят, что правило сохраняется, “при прочих равны х условиях”.
Конечно, в наш ем собственном опыте “прочие условия” редко равны , что
делает изучение оптимальных правил с помощью индукции столь трудным.
(П ервоначальны е исследователи или изобретатели оптимальны х правил
преодолели эти трудности; однако, это отличает их от остальной части нас.)
Получение знаний из опыта... 313
А бстрактны й характер дедуктивны х правил имеет большое значение
относительно трудностей, с которыми сталкиваю тся люди при применении
оптимальны х методов в определенных ситуациях. Эта трудность сосредо­
тачивается вокруг способности различать структуру задач, встроенную в
большое количество подробностей. Поэтому, когда перед нами стоит опре­
деленная проблема, богатая на детали, и в которой детали могут быть несо­
ответствующими или избыточными, внимание к специфическим особенно­
стям, вероятно, отвлечет внимание от общей структуры проблемы. Ф акти­
чески, именно абстрактность дедуктивно изучаемы х оптимальных правил
не позволяет им восстанавливаться из пам яти (см. N isbett и др., 1976, см.
г л. 7). А бстрактные правила, поэтому, могут быть “не доступны” в опреде­
ленны х случаях. Однако спорный вопрос не реш ен, так к ак важ но знать,
почему эти правила не доступны.
Рассмотрим способ, которым комбинации действие-исход, вероятно, орга­
низованы и сохранены в памяти. В частности, рассмотрим, будет ли такая
информация организована и сохранена в памяти по содержанию или по струк­
туре задачи. К аж ется более легким и “естественным” организовать комбина­
ции действие-исход скорее по теме, чем по структуре; например, опыт со ш ко­
лой, родителями, людьми противоположного пола и т.д ., чем задачи Байеса,
ситуации выбора, проблемы оптимизации и так далее. Ф акт, что содержание
может отличиться, в то время к ак структура остается той ж е, весьма трудно
увидеть (Einhorn и др., 1979; K ahnem an & Tversky, 1979b; Simon & Hayes,
1976). Поэтому, я думаю, вряд ли большинство людей организует свои опы­
ты по структуре задачи. Я не говорю, что человек не может научиться дей­
ствовать таким образом. Ф актически, большая часть профессионального обу­
чения именно такова; например, человека обучают обращаться с проблема­
ми к ак принадлежащ ими к некоему классу проблем, имеющих данную струк­
туру и (иногда) известное решение. Оптимальные правила, таким образом,
могут быть “доступны” с помощью обширного обучения. Конечно, существу­
ет опасность, что такие правила будут чересчур легко доступны; то есть про­
блемы вынуждены складываться в несоответствующую структуру, потому
что реш ение существует в пределах этой структуры. Банально, что при стол­
кновении с проблемой, профессионалы рассматривают ее в пределах струк­
тур, видеть которые они были обучены. Поэтому, хотя обучение профессио­
нала действительно включает структуры, такое обучение находится в преде­
лах узко определенной содержательной области.
Дальнейшие сведения, иллюстрирующие потребность в группировании про­
блем скорее по содержанию, чем по структуре, приводятся при рассмотрении
способа, с помощью которого организовано и изучается знание людей о мире.
Например, специализированное образование, профессиональное обучение,
каталогизация информации в библиотеках и энциклопедиях, и так далее, ил­
люстрирует организацию информации скорее по содержанию, чем по структу­
ре. В то время как существуют большие преимущества в организации знания
таким образом, имеются также и недостатки. Трудность применения оптималь­
314 КОВАРИАЦИЯ И КОНТРОЛЬ
ны х правил, разработанных в одной содержательной области, для подобных
по структуре проблем в других содержательных областях может быть одним
таким недостатком. Однако на уровне отдельного ученика рассматриваются
другие трудности, которые могут иметь еще большие недостатки.
Х отя структуру задачи трудно различить, а исходы - легко, они четко
видимы , доступны и часто однозначны. Рассмотрение закрепления с помо­
щью обратной связи исхода необходимо в понимании того, к ак эвристика
сохраняется, несмотря на опыт. Кроме того, если исходы - в значительной
степени ф ункция структуры задачи, и у человека, принимающего реш ения,
недостаточно знания такой структуры , то правила, которые являю тся несо­
ответствующими или даж е недостаточными, могут все еще укрепляться по­
лож ительной обратной связью исхода. (Например, “суеверное” поведение
ж ивотны х при обучении; см. Staddon и Sim m elhag, 1971.)
П редставлены два примера, где нормативно неподходящ ая эвристика
мож ет привести к хорошим исходам и где может отсутствовать понимание
плохого качества правила. Рассмотрим человека, который в магазине под­
ходит к банкам с соком со следую щ ими ценами и качеством (взято из
Tversky, 1969):

Торговая м арка Ц ена Качество


X 60 центов Высокое
Y 55 центов Среднее
Z 50 центов Н изкое
Предположим, что я использую следующее правило, чтобы выбрать одну
и з трех марок: если различие в цене - пять центов или меньше, то я выбираю
марку с более высоким качеством; если различие в цене больше, чем пять цен­
тов, я выбираю согласно цене. Такое простое правило (которое является лекси­
кограф ическим полу-упорядочиванием) подразумевает: Х > Y, Y> Z, но
Z > X. Поэтому, это правило ведет к нетранзитивным выборам, которые я в ­
ляю тся иррациональными. Однако, обратите внимание, что после того, как я
выбираю X, а не Y, то я устраняю Y из оставшегося множества и сравниваю X
с Z. Поэтому, я останавливаюсь на Z, который может оказаться весьма при­
емлемым после того, к ак я попробую сок. Затем я поздравляю сам себя с тем,
что я такой хороший покупатель - я сэкономил деньги и сделал хорошую по­
купку. Важный пункт, на который стоит обратить внимание - то, что не де­
лается сравнения Y с Z, и я не сознаю, что мое правило приводит к нетранзи­
тивному выбору. Все, что я знаю - то, что я сделал выбор с минимальной суе­
той и напряж ением, и исход был удовлетворителен. Положительная обрат­
н ая связь исхода, таким образом, укрепляет нормативно неподходящее пра­
вило, и отсутствует понимание, что что-то неправильно.
Второй пример - вероятностный (cp. Schum, 1980). Вообразите, что Вы -
военный генерал в политически напряженной области, и Вы обеспокоены тем,
что Ваши враги вторгнутся в Вашу страну. Кроме того, из прошлого опыта
Вам известно, что, когда вражеские отряды подходят к границе, вероятность
Получение знаний из опыта... 315
вторж ения - 0.75. Однако у Вас нет прямого доступа к информации относи­
тельно враж еских отрядов, и Вы вынуждены полагаться на сообщение ва­
ш их развед чиков о таких действиях. К ак оказывается, каж ды й раз ваш и ис­
точники разведки сообщают, что отряды сосредотачиваются и что они - дей­
ствительно там. Предположим, что Вы теперь получили сообщение из ваш их
источников, что враж еские отряды - на границе. Какова вероятность втор­
ж ения? Более формально, пусть
Н = гипотеза, что будет вторжение
D = отряды , сосредотачивающиеся н а границе
D* = сообщение об отрядах, сосредотачивающихся на границе
В задаче дано, что р (H|D) = 0.75 и р (D|D*) = 1.0 и спраш ивается относи­
тельно р (H|D*). Если Вы подобны большинству людей, Вы, вероятно, отве­
тите 0.75. Однако, данной информации не достаточно, чтобы ответить на
этот вопрос нормативно правильным способом. Ф актически, возможно, что
в выш еупомянутой задаче р (H|D *) = 0. Так к ак большинство людей счита­
ет, что в это трудно поверить, рассмотрим Рисунок 1, в котором эта задача
проиллюстрирована посредством диаграммы Венна. Обратите внимание, что
пересечение Н с D* пустое, так, что условная вероятность, р (H|D*), нуле­
вая. П ричина, по которой люди считают этот результат таким неожидан­
ным, состоит в том, что они сделали логическую ошибку: если D* =>D , тог­
да D => D*. Х отя D происходит всякий раз, когда дано D*, наоборот проис­
ходит не всегда. Ф актически, интуитивны й способ видения проблемы со­
стоит в том, чтобы думать, что враг настолько хитер, что ваш а разведка ви­
дит их отряды только тогда, когда не планируется никакого вторж ения.
Однако когда вторжение запланировано, и отряды на границе, они скрыты
настолько хорошо, что ваш и источники не сообщают о них.

Рис. 1. Д иаграмма Венна, показы ваю щ ая отнош ения между гипоте­


зой (Н), данной величиной (D) и сообщением о данной величине (D *)
316 КОВАРИАЦИЯ И КОНТРОЛЬ
Этот пример иллю стрирует трудность применения оптимальных правил
(в этом случае, правил формальной логики) к определенной задаче. В то вре­
м я к а к очень мало людей сделали бы логическую ош ибку, когда она пред­
ставлена в очевидной форме, важность примера - показать, к ак определен­
ны е особенности задачи скрываю т ее реальную структуру так, чтобы опти­
мальны е правила были легко наруш ены (см. TVersky и K ahnem an, 1980). В
отнош ении этого примера такж е можно сказать о следующем.
П редположим, что генерал делает логическую ошибку и оценивает веро­
ятность войны к ак 0.75. Тогда он посылает свои войска к границе, таким
образом, вы зы вая враж еское вторж ение. Следовательно, неправильное
рассуждение генерала подкреплено обратной связью исхода: “В конце кон­
цов, - он мог бы сказать, - они напали на нас, к ак мы раньш е и предполага­
л и ”.
Эти два примера иллю стрирую т основной момент этой главы: без знания
структуры задачи, обратная связь исхода может быть несоответствующей
или даж е вредной для исправления неправильной эвристики. Кроме того,
полож ительная обратная связь исхода без знания задачи не дает понять, что
наш и правила являю тся неподходящ ими, так как нет ж елания задавать воп­
рос, к ак был достигнут успех. Условия, при которых обратная связь исхода
не играет исправляю щ ей роли в отношении эвристики и стратегий, обозна­
чен ы к а к н есоответствую щ и е исходу структуры п о л у ч ен и я зн ан и й
(НИСПЗ). Такие структуры могут быть намного более распространены, чем
мы думаем. Перед тем, к ак исследовать одну из таких структур подробно,
рассмотрим вероятностные оценки в пределах структуры НИСПЗ, так как
многие работы по эвристике непосредственно рассматриваю т эти типы оце­
нок. Предположим, что Вы оцениваете вероятность некоторого события, как
0.70. Пусть событие не происходит. Что этот исход говорит вам о качестве
правил, использованных для оценивания? Можно поспорить, что любого
единственного исхода недостаточно, чтобы оценить “совершенство” (то есть,
степень калибровки) вероятностных оценок. Поэтому, в важном смысле, не­
посредственная информация исхода не подходит для исправления непод­
ходящ ей эвристики. Только в том случае, если Вы ведете “таблицу” относи­
тельной частоты исходов при оценке события с данной вероятностью, мож ­
но получить значительную обратную связь от исходов. Однако это является
необходимым, но не достаточным условием для создания соверш енных оце­
нок. Во-первых, какой период времени человек рассматривает таблицу пе­
ред тем, к ак реш ить, является ли оценка откалиброванной или нет? Кроме
того, насколько близким является “достаточно близко”, чтобы говорить, что
оценка точна (в смысле хорошо калибрована)? Обратите внимание, что весь
этот способ оценки исходов вклю чает подкрепление, которое отсрочено на
длительны й период времени. Таким образом, ясно, что такая обратная связь
не произведет значительны й эффект само-исправления. Во-вторых, чтобы
научиться определять совершенство правил для оценки вероятности, таб­
лица долж на вклю чать не только оценки и конечные исходы, но такж е и
Получение знаний из опыта... 317
правила для получения этих оценок. Н апример, если я хранил записи исхо­
дов для 100 случаев, в которы х я дал оценки 0.7, что даст мне информация о
том, что 53 из этих событий произош ли, относительно качества правил, ко­
торые я использовал? Так как вероятно, что много различны х правил могло
использоваться, чтобы оценить вероятности в 100 различны х ситуациях,
информация исхода нерелевантна, и обратная связь исхода не значительна,
если только человек не знает правил и не хранит запись об их использова­
нии (см. N isbett и W ilson, 1977, о том, знаем ли мы наш и собственные ког­
нитивные процессы).
Я не подразумеваю, что невозможно научиться делать совершенные оцен­
ки вероятности. Если человек делает много оценок вероятности в одной и
той же ситуации, к ак , например, синоптики или те, кто пы тается пред­
сказать исходы конны х скачек, и обратная связь исхода быстро получена,
такие условия не могут быть нерелевантными исходу, и обратная связь мо­
жет иметь само-исправляю щ ий характер. Однако такие условия были бы
скорее исклю чением, чем правилом для больш инства из нас.
Х отя вероятностные оценки типично происходят в НИСПЗ, к ак ж е на­
счет не вероятностных оценок? Конечно, если человек делает прогноз, он
может проверить и увидеть, является ли прогноз правильным или нет. По­
этому, казалось бы, исходы должны быть релевантными для обеспечения
само-исправ ляю щ ейся обратной связи. Оставш аяся часть этой главы обсуж­
дает эту проблему в пределах контекста одной общей и распространенной
структуры задачи, хотя определенное содержание таких задач может быть
весьма различно.

Задача вы бора 1
Рассмотрим общую задачу, вовлекающую не вероятностные оценки, так как
информация исхода каж ется к ак доступной, так и уместной в обеспечении
само-исправляющейся обратной связи. Задача, которую нужно рассмотреть
та, в которой оценки сделаны с целью выбора между альтернативными дей­
ствиями. Н апример, рассмотрим ситуацию с двумя возможными действия­
ми, А и В. Обозначим за х целое, оценочное суждением которое может само
быть ф ункцией различны х типов и количества информации. Кроме того,
пусть хс такой предел, что
Если х > х с, соверш аем действие А;
если х < хс, соверш аем действие В
Хоть оно и упрощ ено, уравнение 1 прим еняется ко многим ситуациям, а
такж е ситуациям оценки/реш ения, например: трудоустройство, продвиже­
ние по служ бе, поступление в ш колу, предоставление кредита, назначение
на коррекционны е программы, участие в социальных программах, приня-

1 Многое из этой главы взято из Айнхорн и Хогарт (Einhorn и Hogarth , 1978)


318 КОВАРИАЦИЯ И КОНТРОЛЬ
Y (поведение)

Рис. 2. Комбинации действие-исход, которые следуют из использова­


н и я оценок для реш ения относительно принятия-отклонения

тие статьи в ж урнал, предоставление гранта, и т.д. В этих случаях оценка


степени “достойности” обычно определяет, какое действие должно быть со­
верш ено, так как предпочтительное действие не может быть применено ко
всем.Чтобы сравнить оценку со стандартом, существует критерий, обозна­
ченны й у, и служ ащ ий основанием для определения точности оценки. В то
время к ак практические трудности обнаружения и развития адекватных
критериев огромны, в данном случае вним ания сосредотачивается на тео­
ретических: концепция критерия - то, что необходимо для этого анализа.
Чтобы быть совместимым с формулировкой оценки, далее допускается, что
критерий имеет предел (ус) такой, что у > уси у < усслуж ат основанием для
определения исходов оценки. Таким образом, поскольку мы рассматрива­
ем учение об оценках, представление исходов в пам яти имеет часто катего­
риальную форму, то есть успехи и неудачи (см. E stes, 1976).
Очень важ но обратить внимание, что структура задачи - та, в которой
оценки (прогнозы) приводят к различны м действиям и что исходы исполь­
зую тся к ак обратная связь для определения точности прогнозов. Ф ормаль­
н ая структура может быть замечена при рассмотрении регрессии у от х, а
такж е четы рех секторов, которые следуют из пересечения хс и ус как пока­
зано на Рисунке 2. Обозначим правильны е прогнозы к ак положительные и
отрицательные попадания и два типа ошибок как ложные позитивы (у < у(.| х > хг)к
лож ны е негативы (у > ус | х <хс). Чтобы оценить отнош ения между х н у (то
Получение знаний из опыта... 319
есть, корреляцию между х и у , рху) необходимо иметь информацию относи­
тельно каждой комбинации оценка-исход. Предположим сначала, что та­
к ая и нф орм ац ия становится доступной через какое-то врем я (то есть,
последовательно), и рассмотрим экспериментальные сведения относитель­
но получения знаний об отношениях между х н у при таких обстоятельствах.
Исследование способности оценивать случайности между х н у , исходя из
информации в таблице 2 x 2 (Jenkins и W ard, 1965; Sm edslund, 1963; 1966;
W ard и Jen k in s, 1965) указы вает, что люди судят о силе связей с помощью
частоты полож ительны х попаданий (в терминологии рис.2), игнорируя ин­
формацию в трех других ячейках. Эти результаты чрезвычайно важ ны , так
как они говорят, что даже если вся соответствующ ая информация исхода
доступна, люди не используют ее. Это означает, что в лабораторных иссле­
дованиях, которые имеют релевантные относительно исхода структуры изу­
чения, люди преобразовали их в нерелевантные для исхода структуры изу­
чения. Чем это мож ет объясняться?
Приведем объяснение: наш опыт в задачах реальной ж изни является та­
ким, что мы развиваем правила и методы, которые, к ак каж ется, вполне
хорошо “работаю т”. Однако эти правила могут быть весьма неправильны ­
ми, и наш е понимание их несоответствия глубоко. Этот недостаток понима­
ния сущ ествует, потому что полож ительная обратная связь исхода может
происходить, скорее, несмотря, чем благодаря наш ей прогнозирующей спо­
собности. Чтобы проиллю стрировать это, рассмотрим исследование Басона
(W ason, I960), в котором он предоставлял испытуемым последовательность
с тремя числам и, например: 2 ,4 ,6 . Испытуемых просили обнаружить пра­
вило, которому эти три числа подчинялись (правило, расположения по воз­
растанию). Чтобы обнаруж ить правило, им разреш али создавать наборы
трех чисел, которые экспериментатор классифицировал к ак подходящ ие
или не подходящ ие под это правило. В любой момент испытуемые могли
остановиться, когда они думали, что они обнаружили правило. Правильное
решение этой задачи должно вклю чать поиск опровергающего свидетель­
ства, а не накопление подтверждаю щ их. Например, если кто-то предпола­
гал, что правило имеет некоторое отношение к четным числам, это могло
быть проверено только, перебирая последовательность, включающую нечет­
ные числа (то есть, накапливание большого количества подтверждающ их
примеров последовательностей четных не будет вести к правилу). То, что
только 6 из 29 испытуемых наш ли верное правило с первого раза, иллю ст­
рируют опасность индукции простым перечислением. К ак указы вает Б а­
сон (W ason, 1960), реш ение этой задачи должно вклю чать “готовность пы ­
таться фальсифицировать гипотезы, и таким образом, проверять те интуи­
тивные идеи, которые так часто придают чувство уверенности “ (с. 139,
нами добавлено выделение курсивом).
Важно подчеркнуть, что в эксперименте Басона, где не было действий,
возможен поиск опровергающего свидетельства. Однако когда действия ос­
нованы на оценке, изучение, основанное на опровергающем примере, ста­
320 КОВАРИАЦИЯ И КОНТРОЛЬ
новится более трудным. Рассмотрим, к ак можно было ошибочно усвоить
неверное правило для оценивания, и рассмотрим гипотетическую ситуацию
с менеджером, изучающ им свою прогнозирующую способность относитель­
но “потенциала” кандидатов на работу. Важный фактор здесь - то, что дей­
ствия (например, принимать / не принимать) - зависят от оценок. В следу­
ю щ ий раз менедж ер может только экзаменовать принятых кандидатов,
чтобы проверить, сколько из них “успеш ны”. Если успехов много, что веро­
ятно, тогда все эти случаи подтверждают правило. Действительно, важ ны й
момент - то, что было бы трудно опровергнуть правило, даж е при том, что
оно могло быть ошибочным. Одним из способов, которым менеджер может
проверить правило, будет принять несколько человек, которые, к ак он оце­
нивал, имели низкий потенциал и затем понаблюдать за их успехами. Если
бы их успехи были столь ж е вы соки, к ак и у кандидатов с оцененным высо­
ким потенциалом, правило было бы опровергнуто. Однако систематический
поиск опровергающ их свидетельств редок, и против него можно было бы
возраж ать на прагматических и даж е этических основаниях, то есть чело­
век был бы должен отказать в предпочтительном действии тем, кого он оце­
нил к ак более достойных, и передать его тем, которые были оценены как
наименее достойные. Поэтому, прагматические и /и л и этические соображе­
н ия могут препятствовать даж е мыслям о возможности сбора опровергаю­
щ ей информации. Обратите внимание, что тенденция не проверять гипоте­
зы контрпримерами - прямое следствие структуры задачи, в которой дей­
ствия приняты на основе оценок. Васон (W ason, 1960) указы вает, “В реаль­
ной ж изни нет силы , позволяю щ ей делать оценку на основании выводов:
выводы могут только быть проверены данны ми” (с. 139). В результате, мно­
го положительной обратной связи мож ет привести к укреплению невалид­
ного правила.
Х отя влияние исходов на несовершенное действие может не рассматри­
ваться, возможно, что человек будет исследовать количество полож итель­
ны х попаданий и лож ны х положительных к ак способ проверить точность
прогнозов. Поэтому, в то время как такая информация неполна для точной
оценки отнош ений между прогнозами и исходами, такая информация - то,
что доступно большинству людей. Поэтому важ но рассмотреть факторы , ко­
торые затрагиваю т эти переменные.

Ф а к т о р ы , в о зд ей ств у ю щ и е н а п о л о ж и те л ь н ы е п о п а д а н и я и л о ж ­
н ы е п о л о ж и те л ь н ы е
Рассмотрим Рисунок 2 снова и обратим внимание, что существуют три ф ак­
тора, которые затрагиваю т пропорции положительных попаданий и лож ­
ны х позитивов; местоположение хс, ус, и “наклон” эллипса (который я в л я­
ется корреляцией между х и у). Например, если хссмещен направо, а значе­
н и я хс и рхупостоянны, имеется точка, в которой не будет никаких лож ных
позитивов. Конечно, будет соответствующее увеличение лож ны х негативов.
Получение знаний из опыта... 321
Однако если у человека нет информации относительно этих случаев (как
ситуации вообще), опыт успеха может убеждать, что качество оценивания
высоко. Поэтому, когда критерий для предоставления предпочтительного
действия поднят (увеличивая хс), вероятность того, что р (х > хс) (такж е на­
зываемое отношением выбора, <р), уменьш ится, и это приведет к высокому
положительному попаданию и низким пропорциям ложных позитивов. Дру­
гой ф актор, ус, очевидно влияет на исходы, так к ак уровень ус определяет
успех и неудачу. Обратите внимание, что когда значение ус пониж ается,
вероятность, что р (у > ус) (такж е назы ваем ая базовым значением, Ьг, уве­
личивается, и опыт успехов мож ет быть высок независимо от способности к
оцениванию; то есть если бы вы наугад назначили людей для выполнения
различны х действий, вы бы получили пропорцию успеха, равную р (у > ус).
Поэтому, чтобы оценить способность к прогнозированию , должно быть про­
ведено сравнение пропорции положительного попадания с р (у >уе), и спо­
собность к оценке определена при незначительном увеличении в успехе. Тре­
тий ф актор, р „ . прямо пропорционален исходам; то есть, чем больше pv .
тем больше процентное отношение полож ительны х попаданий.
Влияние этих трех факторов на процентное отношение положительных
попаданий хорошо известно. Тейлор и Расселл (Taylor & R ussell, 1939), на­
пример, показали, что можно повысить процентное отношение положитель­
ны х попаданий, для любых данны х рху и базового значения, путем умень­
ш ения отнош ения выбора (<р), то есть, предоставляя предпочтительное дей­
ствие меньш ему проценту людей (допустим, р v„ * 0). Таким образом, даж е
если р ху низкое, возможно получить высокое процентное отношение поло­
ж ительны х попаданий, зависящ ее от величин (р и Ьг. Тейлор и Расселл (1939)
приводят таблицы процентных отнош ений положительных попаданий для
большого разнообразия значений р , <р и Ьг. Исследование этих таблиц по­
казы вает, что н изкая корреляция между оценками и критериям и вполне
совместима с большим процентным отношением положительных попада­
ний.
В дополнение к трем уж е упомянутым факторам необходимо рассмотреть
и четверты й ф актор. Он может быть проиллю стрирован с помощью следую­
щего воображаемого эксперимента. Пусть о некоторых лю дях сделано не­
которое множество оценок. Половину из тех, которые были оценены выш е
хс, наугад назначаем вы полнять действие А , а вторую половину - действие
В. Подобным образом поступаем с теми, чья оценка не превысила хс. Через
некоторое врем я измеряем поведение и подсчитываем пропорцию людей с
у > усв каж дой клетке (каж дому человеку приписано 1 или 0, чтобы обозна­
чить, ниж е он или выш е предела у - пропорция, больш ая усв таком случае
просто среднее клетки). Это факторны й план 2x2, причем один фактор - это
“оценка”, а другой “тип действия”. Заметьте, что так как критерий не мо­
ж ет быть измерен непосредственно перед решением (и действительно, если
это было бы так, то в оценке не было бы необходимости), люди, получающ ие
действия А и В, такж е получили различное экспериментальное воздействие.
322 КОВАРИАЦИЯ И КОНТРОЛЬ
Если бы этот эксперимент был проведен, можно было бы протестировать ос­
новное влияние оценки (что измеряет его точность); основное влияние на
действие, то есть, влияет ли само получение А или В на поведение; и взаимо­
действие между оценкой и действием. Обратите внимание, что преимущ е­
ство эксперимента состоит в том, что он позволяет нам узнать точность оцен­
ки из влияния отнош ения действия. К ак бы там ни было, такой экспери­
мент редко проводится, даж е умозрительно, и, конечно ж е, он не проводит­
ся лю дьми, не прош едш ими углубленное обучение планированию экспери­
ментов. Таким образом, точность оценок всегда будет связана с возможным
влиянием отнош ения, обусловленного действием. Более того, ссы лаясь на
более раннее обсуждение, можно сказать, что этот эксперимент позволяет
проверить опровергающую информацию. В отличие от больш инства реаль­
ны х оценочных задач, он позволил бы опровергнуть гипотезу точности оцен­
к и , также как и оценить любое влияние отнош ения, обусловленного дей­
ствием.
П ример влияния отнош ения показан на Н исунке 3. Эллипс, изображен­
ны й пунктиром, тот ж е, что и был наН исунке 2, и он показы вает “истин­
ное” взаимоотнош ение между оценками и исходами. Заш трихованная об­
ласть обозначает наблюдаемые исходы; таким образом, показаны только зна­
чения, для которы х х > хс. В лияние отнош ения проявляется в том, что ис­
ходы (т.е. поведение) всех людей, которым было дано действие А , увеличе­
ны на некоторую константную величину, так что количество полож итель­
ны х попаданий больше, чем если бы она была при отсутствии эффекта отно­
ш ения. С психологической точки зрения главны й аспект на Рис. 3 - это
то, характер обратной связи искаж ен, количество полож ительны х попада­
ний резко увеличилось, а количество лож ных позитивов резко сократилось.

Y (поведение)

Рис. 3 Влияние отнош ения на пропорцию наблюдаемых полож итель­


ны х попаданий
Получение знаний из опыта... 323
Чтобы измерить влияние четырех выш еупомянутых факторов на пропор­
цию полож ительны х попаданий, Айнхорн и Х огарт (Einhorm & H ogarth,
1978) смоделировали эксперимент, в котором различные уровни воздейству­
ющих факторов отнош ения выбора, базового значения и способности к про­
гнозированию изменялись по факторному плану. Зависимой переменной
было процентное отношение положительных попаданий. Результаты этого
эксперимента могут быть представлены следующим образом: (а) в общем,
пропорция полож ительны х попаданий больше, чем 0.50. Если существует
влияние отнош ения, то процентное отношение положительных попаданий
может быть высоко даж е при рху= 0; (Ъ) когда (р < Ьг, процентное отноше­
ние полож ительны х особенно высоко. Кроме того, пропорция полож итель­
ных попаданий зависит от влияния отнош ения при низких значениях р .
Это означает, при ситуациях выбора плохая способность к прогнозирова­
нию, закрепится положительной обратной связью исхода, (с) При <р > Ьг,
отношение полож ительны х попаданий - наименьш ее. Однако, малые воз­
действия факторов имеют существенное влияние на увелечение процентно­
го отнош ения положительных попаданий в этих ситуациях.
Результаты смоделированного эксперимента показывают, что положитель­
ная обратная связь может существовать, если способность к прогнозирова­
нию крайне м ала, и что осознание этого обычно мало из-за неудачи соответ­
ственно понять структуру задачи. Поэтому, хотя можно было предположить,
что не вероятностные оценки сделаны в уместной исходу структуре изуче­
ния, когда оценки делаются с целью реш ения, какое действие предпринять,
информация исхода может быть нерелевантной для обеспечения само-исправ-
ляющ ейся обратной связи.

Заклю чен и е 2
Основной темой этой главы было, что информация исхода, без знания струк­
туры задачи, может быть несоответствующей для обеспечения само-исправ-
ляю щ ейся обратной связи относительно неподходящ ей эвристики. Такж е
обсуждалось, что знание структуры задачи трудно достичь из-за индуктив­
ного способа, которым мы получаем знания из опыта (см. Ham m ond, 1978,
Галилейевский способ мы ш ления против Аристотелевского). Эти выводы
поднимают две проблемы, которые будут кратко обсуждены.
М ожет быть, что даже со знанием структуры задачи, человек действует
таким способом, который меш ает получению знаний. Например, рассмот­
рим официанта в ш умном ресторане. П оскольку у него нет времени, чтобы
обеспечить хорошее обслуживание всем клиентам, он делает прогноз, отно­
сительно того, каки е клиенты оставят хорошие или плохие чаевые. Хоро­

2Я бы хотел поблагодарить J. Е. R. Staddon за поднятие проблем, обсужденных в этой гла­


ве.
324 КОВАРИАЦИЯ И КОНТРОЛЬ
ш ее или плохое обслуживание распределяется в зависимости от прогноза.
Если качество обслуживания оказы вает влияние на размер чаевых, исходы
“подтверждают” первоначальные прогнозы. Обратите внимание, что офици­
ант мог бы провести эксперимент, чтобы не допускать зависимости качества
обслуживания от своих предсказаний, если бы он знал структуру задачи; то
есть он мог бы предоставлять плохое обслуживание некоторым лю дям, кото­
рые, к ак он судил, оставят хорошие чаевые, и хорошее обслуживание тем лю­
дям, которые, к ак он оценил, оставят плохие чаевые. Однако обратите вни­
мание, что официант должен захотеть рискнуть возможной потерей дохода,
если его суждение точно, взамен на знание, что его оценка является непра­
вильной. Последняя информация может принести ему отдаленную выгоду,
так к ак она может побудить его делать прогнозы лучш е или, если это невоз­
можно, использовать стратегию предоставления хорошего или плохого об­
служ ивания наугад, таким образом, экономя много умственных усилий. В
принятии решений в организациях, отдаленные выгоды от знания точности
прогнозов могли быть существенны. Например, если отборочные собеседова­
ния не прогнозируют выполнение работы (независимо от влияния отноше­
ния), зачем тратить деньги и время, используя их? Поэтому, затраты и выго­
ды от короткосрочных стратегий для действия по сравнению с отдаленными
стратегиями получения знаний должны быть более тщ ательно исследованы.
Вторая проблема возникает при рассмотрении следующего вопроса: и зу­
чаю т ли люди, и продолжают ли они использовать несоответствующие пра­
вила, и не противоречит ли это эволюционной концепции вы ж ивания силь­
нейш их? Под этим вопросом я подразумеваю, что те, кто используют не­
адекватны е правила, менее вероятно, должны вы ж ить, чем те, кто исполь­
зуют лучш ие правила (они - сильнее). Однако, использование лучш их пра­
вил все еще весьма далеко от использования оптимальны х правил. Концеп­
ц и я наибольш его “соответствия” вклю чает относительное упорядочение, в
то время как оптимальность подразумевает некоторый абсолютный уровень.
Следовательно, тот ф акт, что условно оптимальные правила сохраняю тся,
несмотря на опыт, не противоречит теории Дарвина. Возможно, наиболее
краткий способ вы разить это процитировать Эразма: “В стране слепы х, и
одноглазый человек - король.” 3

3 Смысл этой цитаты состоит в том, чтобы указать, что о т н оси т ельн ы е преимущества в
отношении окружающей среды важны. Мы не оскорбляем слепых людей. Том Воллстейн
сделал следующий комментарий, “В стране слепых, одноглазый человек может выжить,
только закрыв свой глаз, так как окружающая среда будет устроена так, что он будет пола­
гаться на другие чувства”. Хотя это - очаровательный комментарий, я не соглашаюсь с ним,
потому что одноглазый человек имел бы другие чувства в дополнение к преимуществу зре­
ния.
П о л уч ен и е зн а н и й из оп ы т а... 325
Часть VI
Чрезмерная уверенность
20. Чрезмерная уверенность в суждениях,
основанных на конкретных примерах*

Стюарт Оскамп

Это обычное явление в клинической практике: когда психолог накапливает


исследовательский материал относительно человека, он начинает думать,
что хорошо знает его. Следовательно, рано или поздно в процессе сбора ин ­
формации психолог чувствует себя достаточно уверенным, чтобы делать ди­
агностические заклю чения, описывать главную динамику клиента, и воз­
можно даж е, чтобы отваж иться сделать прогноз его будущего поведения.
Х отя заклю чения психолога могут остаться предварительными, усиление
уверенности от времени первого столкновения с пациентом ко времени на­
писания своего сообщения обычно очень заметно.
Это исследование рассматривает, оправдано ли это увеличение уверенно­
сти соответствующим увеличением точности заклю чений. Х отя уверенность
психолога в его заклю чениях часто упоминалась к ак важ ны й предмет на­
учного исследования (M eehl, 1957), она редко интенсивно исследовалась.
Кроме того, когда она исследовалась, часто получались довольно удивитель­
ные результаты . Н апример, Л .Р . Голберг и Оскамп (L. R . G oldberg, 1959 и
Oskam p, 1962) показали, что диагностическая достоверность опытных пси­
хологов меньше, чем у менее опытных людей. Те ж е самые исследования и
многие другие показали, что профессиональные психологи являю тся не луч­
ш ими экспертами в межличностных отнош ениях, а иногда и худш ими, чем
необученные люди (T aft, 1955).
Другим редко исследуемым фактором, который может обеспечить хоро­
ш ий показатель опытности эксперта, является отношение между уровнем
его достоверности и уровнем точности. Эта величина показы вает, например,
является ли судья самонадеянным при принятии реш ений или, наоборот,

' Эта глава первоначально появилась в Журнале консультационной психологии (The Journal
of Consulting Psycohology), 1965, 29, 261-265. Авторское право © 1965 принадлежит Аме­
риканской Психологической Ассоциации. Переиздано в соответствии с разрешением.
330 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
он не слиш ком уверен в себе. Относительно этой величины, которая может
быть названа правомерностью достоверности, было обнаружено, что опыт­
ные “оценщ ики”, превосходят неопытных (Oskamp, 1962).
Многие исследования (Hamlin, 1954; H athaw ay, 1956; K ostlan, 1954 ;
Soskin, 1954; W inch & More, 1956) рассматривали влияние различного ко­
личества информации стимула на клиническое принятие решений. В н а­
стоящем эксперименте этот фактор изучался путем предоставления каж до­
му испытуемому четырех множеств кумулятивно увеличивающегося коли­
чества информации, как основания для принятия им решений. Таким об­
разом, было смоделировано постепенное наращивание информации при ра­
боте психолога над типичным случаем.
Исследовательские гипотезы были следующие:
1. После некоторого момента в процессе сбора информации, точность про­
гнозирования достигает максимума.
2. Однако, уверенность в решениях продолжает устойчиво расти, посколь­
ку получено большее количество информации.
3. Таким образом, к концу процесса сбора информации, большинство
испытуемых самонадеянны относительно своих оценок.

П роцедура
Так как было желательно, смоделировать обычную клиническую ситуацию настоль­
ко точно, насколько возможно, в качестве информации, которая предложена ис­
пытуемым, было выбрано реальное исследование. В конечном итоге, случай был
выбран из-за его обширности, из-за того, что он охватывал многие подходящие
ж изненны е случаи, и потому, что он описывал относительно нормального челове­
ка (то есть случай неадаптированности молодого человека, который никогда не
помещался в психиатрическую лечебницу). Это был случай Джозефа Кидда (Joseph
Kidd), о котором сообщил Уайт (W hite, 1952) в своей книге “Ж изни в развитии”
(Lives in P rogress).1
Материалы относительно этого случая были организованы в хронологические
наборы информации, которые были представлены испытуемых в четыре последо­
вательных этапа. Этап 1 содержал только следующую краткую демографическую
информацию относительно этого случая, чтобы проверить спрогнозированную точ­
ность на уровень “психологической вероятности” (Patterson, 1955):
Д ж озеф у Кидду (псевдоним) - 29 лет. Он белый, не состоит в браке, явля­
ется ветераном Второй Мировой Войны. Он - выпускник колледжа, рабо­
тает бизнес-ассистентом в студии цветочной декорации.
На этапе 2 было добавлено полторы страницы материала, напечатанных через
один интервал, относительно детства Кидда до 12 лет. Этап 3 (2 страницы) рассмат­

1Использование этого случая имело один недостаток. Несколько испытуемых помнили, что
они читали этот материал во время их обучения, но все кроме одного, сообщили, что их
более раннее знакомство никак не помогло им в этом исследовании. Так как их точность,
подтвердила это впечатление, их результаты были сохранены в анализе данных.
Чрезмерная уверенность в суждениях... 331
ривал его годы, проведенные в школе и колледже, а этап 4 ( 1 7 дстраницы) охваты­
вали его службу в армии и более поздние действия до возраста в 29 лет.

И сследование на конкретном примере


Чтобы иметь основание для определения точности испытуемых, было пост­
роено испы тание множественного выбора, используя метод, подобный ме­
тоду Соскина (Soskin, 1 9 5 4 ). П ункты опросника описывали обычные образ­
цы поведения Кидда, отнош ения, интересы и типичные реакции на собы­
тия ж изни. Примеры некоторых этих пунктов даю тся в табл. 1.

Таблица 1. Примеры пунктов опросника


5. Будучи учащимся колледжа, когда Кидд был в знакомой и
благоприятной социальной ситуации, он часто:
a. Пытался направить группу и навязать ей свои желания.
b . Оставался в стороне, отдельно от группы.
c. Его не волновало то, как люди реагировали на него.
d. Принимал активное участие в группе, но тихим и скром­
ным способом.
e. Вел себя, как клоун и хвасталсяа

10. П озж е во время службы в армии, будучи офицером и коман­


дующим отделением, отношение Кидда к наказаниям было:
a. Он очень тревожился об этом, потому что предпочитал быть
на одном уровне с другими людьми, а не выше и х а
b . Он не любил этого, потому что он никогда не мог принять
решение относительно того, что делать.
C. Он избегал этого настолько полно, насколько возможно, по­
тому что чувствовал, что неправильно наказывать людей, неза­
висимо от того, что они сделали.
D. Он был счастлив, потому что это давало ему шанс контро­
лировать ситуацию и быть выше других.
E. Он испытывал садистское наслаждение, наказывая других,
в качестве компенсации за то время, когда наказывали его.

15. Настоящее отношение Кидда к своей матери:


a. Любовь и уважение к ее идеалам.
b . Нежная терпимость к ее недостаткам.
c. Как уважение, так и негодование3.
d. Отвержение ее и всех ее убеждений.
e. Почтительная, но формальная привязанность.

20. В беседах с мужчинами, Кидд:


a. Предпочитает располагать их говорить о работе и опы теа.
b . Предпочитает говорить, главным образом, о знакомых вещах.
c. Предпочитает спорить с ними о религии или их философии
ж изни.
332 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
d. Любит хвастать относительно своей службы в армии или
учебы в колледже.
f. Говорит главным образом о спорте, сексе и отпускает гряз­
ные шутки.

25. Отношение Кидда к ж изни как бизнес-ассистента вызвано его


недавним решением:
a. Остаться на этой работе, по крайней мере, еще несколько
лет.
b . Расширить бизнес, построив другой магазин в близлежа­
щем городе.
c. Оставить работу и открыть собственный цветочный мага­
зин.
d. Подать заявления о приеме на работу в несколько более
крупных компаний в сфере деятельности, подобной его настоя­
щей работы.
e. Совсем уволиться и найти работу другого р одаа_________

аПравильный ответ.

Варианты ответов были построены только там, где имелись довольно объек­
тивные информационные критерии, представленные в случае, ф актические
данные или хорошо зафиксированные выводы. Четыре неправильны х аль­
тернативы в каж дом пункте были составлены аспирантами по психологии
посредством дополнения предложений к основе пункта. Они были построе­
ны таким образом, чтобы быть явно неправильны ми, основанными на опуб­
ликованном материале случая, но быть убедительными и “привлекатель­
ны м и” альтернативами. Ни один из пунктов не содержал ответ, который
можно было обнаружить в полученном вводном материале случая. Испы­
туемые долж ны были следовать обычной процедуре в клиническом приня­
тии реш ений (С. M cA rthur, 1954), формируя картину индивидуальности
Кидда из представленного материала и затем прогнозируя его отнош ения и
типичны е действия, основываясь на картине его личности.

Эксперты
Эксперты были взяты из трех групп с разны м опытом в психологии: (а) 8
психологов, работаю щ их в государственной больнице ш тата К алифорния,
причем у каж дого было несколько лет опыта терапии, и 5 имели кандидатс­
кую степень; 2(Ь) 18 аспирантов в области психологии;3и (с) б студентов стар­

2Еще один психолог участвовал в тестировании, но его результаты пришлось аннулировать,


так как он не понял инструкций и не смог им следовать. Эта проблема не случилась ни с
одним студентом.
3 Приблизительно половина этих аспирантов имела некоторый опыт терапии или консуль­
тирования, и один или два из них, возможно, по уровню опыта в психологии равнялись
психологам
Чрезмерная уверенность в суждениях... 333
ш их курсов, занимаю щ ихся исследованием личности. Ни один из испытуе­
мы х не был знаком с гипотезами исследования.
Испытуемые принимали участие в эксперименте в маленьких группах
размерами от четырех до девяти человек, но каж ды й работал своим собствен­
ным индивидуальным темпом и с собственной пачкой материалов. После
чтения материалов каждого этапа случая, испытемый отвечал на все 2 5 воп­
росов случая, прежде чем перейти к следующему этапу. В дополнение к от­
вету на вопросы, испытемый такж е указы вал в каж дом пункте, насколько
он был уверен в том, что его ответ был правильны й.

О ценки уверенност и
Оценки уверенности были сделаны , используя ш калу, изобретенную Адам­
сом (Adam s, 1957), которая определяет уверенность в терминах ожидаемо­
го процента правильны х реш ений. Так к ак было пять альтернатив для к аж ­
дого пункта теста, ш кала начиналась с 20% (что представляло полностью
случайный уровень достоверности) и заверш алась 100% (что указы вало на
абсолютную уверенность в правильности). В дополнение к обеспечению по­
нятного объективного значения уверенности, эта ш кала имеет большое пре­
имущ ество, т.к . позволяет напрямую сравнить уровень точности и уровень
уверенности. Таким образом, например, если у испытемого 28% пунктов
правильны е, а средний уровень уверенности 43% , он, безусловно, самоуве­
рен.

Р е зу л ь т а т ы
Эта задача оценки, оказалась достаточно трудной, по крайней мере, для этого
материала о случае. Ни один испытемый не достиг точности 50% , и средняя
результирую щ ая точность была меньш е 28 % , со случайностью 20% (незна­
чительное различие). Однако этот низкий уровень точности служ ит для того,
чтобы обеспечить еще более серьезное испытание гипотез исследования.
Бы л выполнен предварительный анализ, чтобы сравнить оценки трех
групп испытуемых, хотя не было сформулировано гипотез об их относитель­
ны х результатах. Эти результаты ясно указали, что не было никаких сущ е­
ственных различий между тремя группами испытуемых ни в точности, ни
в уверенности, ни в общем количестве измененных ответов. Полученные ре­
зультаты уверенности на этапе 4 сравнивались с результатами предыдущих
исследований (Goldberg, 1959; Oskamp, 1962), показы вая, что более опы т­
ные испытуемые, менее уверенны, чем менее опытные испытуемые, но в
этом исследовании эти результаты не приближ ались к значимым.
334 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ

Таблица 2. Результаты 32 испытуемых в исследовании конкретного слу­


чая по 25 пунктам .

Средние оценки

Этап 1 Эт ап 2 Этап 3 Этап 4 F Р


И зм ерение

Точность (%) 26,0 23,0 28,4 27,8 5,02 0,01

Уверенность (%) 33,2 29,2 46,0 52,8 36,06 0,001


Количество
измененных 13,2 11,4 8,1 21,56 0,001
ответов ‘

Главные результаты исследования показаны в Таблице 2, где следующие


друг за другом столбцы показы ваю т средние результаты испытуемых, по
мере того, к ак они получали последовательно увеличиваю щ ееся количество
информации. В результате предыдущ их статистических тестов, результа­
ты для всех 32 испытуемых объединены в этой таблице.
П ервая строка в Таблице 2 показы вает, что колебание в точности по че­
ты рем этапам было сущ ественно. О днако, статисти ческий тест Д ун ка­
н а (А . Е. Edw ards, 1960, с. 136) показал, что это разница возникла прежде
всего благодаря снижению точности на этапе 2. При сравнении точности на
этапе 1 с точностью на этапе 4 не было обнаружено никаких сущ ественных
изменений (t= 1.13, d f = 31). Таким образом, первая гипотеза относительно
максимум а точности была не только поддержана, но в этом эксперименте
не было никакого существенного увеличения в точности с увеличением ин­
формации!
Гипотеза 2 проверена во второй строке табл. 2. Там мы видим, к ак и было
спрогнозировано, резкое и очень существенное увеличение достоверности с
33% на Этапе 1 до 53% на этапе 4.
Н аконец, результаты гипотезы 3 обозначены сравнением первых и вто­
ры х строк таблицы. Н а этапе 1 средняя величина самоуверенности была 7
пунктов; на этапе 4 она была 25 пунктов, различие, существенное далеко за
пределами уровня 0.001 (t = 5.14, d f = 31).
И ногда средние величины группы сущ ественны, но они могут вводить в
заблуж дение, потому что они могут скры вать ответы отдельных испытуе­
м ы х, которы е противоречат прогнозам. То, что дело здесь было не в этом,
ясно показано следующ ими числами для отдельных испытуемых. Из 32
испы туемы х, 14 увеличили точность ответов от этапа 1 к этапу 4, в то время
к ак для 6 точность осталась той ж е, и для 12 уменьш илась - полностью слу­
чайны й результат. Наоборот, все испытуемые, кроме 2, увеличили уверен­
Чрезмерная уверенность в суждениях... 335
ность, и большинство — зам етно4. Н а этапе 1 почти половина испытуемых
(13 и з 32) не были самоуверенными; к этапу 4 осталось только 2 испытуе­
мы х, которые были не очень уверены в себе - высоко значимое изменение
(X2 = 9.1, р < 0.01).
Другой интересный результат исследования содержится в последней стро­
ке Таблицы 2, в которой показано среднее число пунктов, на которы х испы ­
туемые изменили свои ответы на каж дом этапе случая. Эта величина пока­
зы вает, что, поскольку представлялось большее количество информации,
число измененны х ответов уменьшилось заметно и существенно. Это зак ­
лючение говорит о том, что испытуемые часто формировали довольно твер­
дые стереотипные выводы и з первого отрезка информации и затем неохот­
но м еняли свои выводы, когда они получали новую информацию. Во вся­
ком случае, заклю чительны й этап информации, служ ит скорее для того,
чтобы подтвердить предыдущие впечатления испытуемых, чем побудить их
обновить полную картину личности Кидда.

О б суж д ен и е
Необходимо избегать небрежного обобщения этих результатов. Имеются три
главны х ф актора относительно этого исследования, которые могли бы ог­
раничить общность результатов, (а) случай может быть не похож на те, с
которыми большинство психологов привы кло работать. (Ь) П ункты теста
не могут представлять те виды поведения, которые психологи привы кли про­
гнозировать. (с) Испытуемые, возможно, не были типичными представите­
лями людей, принимаю щ их психологические реш ения. В ответе на эти воз­
можные возраж ения должно быть указано, что случай, пункты теста и ис­
пытуемые-психологи - все были выбраны с намерением приблизиться к си­
туациям , встречаю щ имся в фактической психологической практике.
Д аж е если эти возможные возраж ения могут быть предоставлены, неко­
торые четкие заклю чения могут быть сделаны. Независимо от того, к аза­
лась ли задача странной или материалы случая нетипичными, оценки уве­
ренности испытуемых показы ваю т, что они убедились в увеличении своего
понимания случая. П оскольку они получили большее количество инфор­
мации, их уверенность резко возросла. Более того, их уверенность относи­
тельно собственных реш ений стала обратно пропорциональна фактической
правильности этих реш ений.
Таким образом, хотя этот результат не может повторяться для каж дого
психолога и каж дого типа реш ений, можно четко заклю чить, что усили­

4Один из двух испытуемых, у которых уменьшилась уверенность, старшекурсник, позже


заявил, что обычно у него увеличилась бы уверенность, но он только что участвовал в науч­
но-исследовательской работе с компьютерами, в которой компьютер неоднократно давал
неправильные результаты, причем настолько, что он полностью потерял свою уверенность
даже в компьютерах.
ваю щ ееся чувство уверенности психолога во время прорабатывания ситуа­
ции - не надеж ны й признак увеличения точности его заклю чений. Так н а­
зы ваем ая клиническая надежность, основанная на личны х чувствах уве­
ренности клинициста, не является адекватным свидетельством валиднос­
ти оценки в диагностировании или прогнозировании человеческого поведе­
н ия.
21. Сообщение о процессе обучения оцениванию
вероятности*

Марк Алпертп и Ховард Раиффа

В исследованиях принятия реш ений в условиях неопределенности, людей,


принимаю щ их реш ения и их квалиф ицированны х консультантов часто
просят оценить распределения вероятности величин, значения которых им
неизвестны. Эта глава рассматривает некоторые эмпирические результаты,
касаю щ иеся таких вопросов к ак: Н асколько хорошо могут необученные
люди давать подобные оценки? П роявляю т ли они некоторые повторяю щ и­
еся предубеждения? К ак можно калибровать людей, делающ их оценки? К ак
их можно научить оценивать лучш е?
Эта глава рассматривает только оценки неопределенных величин, кото­
рые могут принимать континуум возможных значений. Следовательно, мы
будем работать исклю чительно с одновариантными ф ункциями плотности
и их кумулятивны м и ф ункциями распределения. Существует несколько
различны х процедур для оценки распределений вероятности непрерывных,
одновариантных случайных переменных, но мы рассмотрим только одну
специфическую процедуру, которую мы и наш и коллеги часто использова­
ли на практике. Она назы вается методом прямой оценки квантиля.

П р о ц ед у р а п р ям о й о ц ен к и к в а н т и л я
Пусть х* - истинное, целевое значение некоторой переменной, и предполо­
ж им, что оно неизвестно оценивающему, i f -тый оценочный квантиль х* (для
к в интервале от 0 до 1) - это число хк, которое означает, что оценочная веро­
ятность того, что он припиш ет событию {х* < хк}равна k; в терминах вероят­
ности, Р {х* < хк}= к. Н а числа х0 50, х025 и х075будут ссы латься как на оце­
ночную медиану, ниж ний квартиль и верхний квартиль, соответственно.

* Эта глава первоначально появилась в 1969 как неопубликованное сообщение. Она была
пересмотрена специально для этой книги.
338 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Чтобы получить х0 ж, испытуемый долж ен представить такую величину,
которая настолько ж е вероятна, что х* к ак ниж е х0 ^ так и выш е - х050.
Таким образом, х0 50делит континуум на два оценочных, одинаково вероят­
ны х интервала. Более низкий квартиль, х025, делит интервал (-°°, х 50) на
два оценочных одинаково вероятных интервала; и верхний квартиль, х0 75,
делит интервал (х0 50, + оо) на два оценочных интервала с одинаковой вероят­
ностью. Д ля каж дой неопределенной величины , наш их участников экспе­
римента попросили определить их оценочную медиану и квартили. После­
довательность (или “когерентность”, к ак предпочитают писать некоторые
авторы) требует, чтобы испытуемый считал, (а) что каж ды й из этих четы ­
рех интервалов

( 0 0 ’ Х 0.25^’ ( Х 0 .2 5 ’ Х 0 .5 о )’ ( Х 0.50’ Х 0.75 ) ’ O w +со)

с равной вероятностью, будет содержать истинное значение х*, и (Ь) вероят­


ность того, что истинное значение х* не будет содерж аться в интервале
(х0 2б, х0 75). В будущем, мы будем назы вать интервал (х0 25, х0 75) оценочным,
м еж квартильны м диапазоном. Испытуемых, которые участвовали в наш их
упраж нениях, обучили проверять эти требования последовательности и их
проинструктировали, что в случаях непоследовательности необходимо за­
ново оценить свои оценки квантиля, чтобы ее достичь.
В дополнение к оценочной медиане и двум квартилям , испытуемых про­
сили оценить различны е квантили на нижнем и верхнем пределе их распре­
делений. Об этом мы расскаж ем дальш е. К ак только оцениваю щ ий опреде­
лил несколько (хк, к) пунктов в своем совокупном, левостороннем оценоч­
ном распределении вероятности, он может использовать прямой, произволь­
ный процесс для того чтобы “подогнать” остататок кривой. В этой главе,
однако, мы будем касаться только непосредственно оцененных (хк, к) пунк­
тов, а не полной кривой.

В о зм о ж н о сть вн еш н ей в а л и д и за ц и и
Если все, что мы имеем от данного испытуемого, это одно распределение ве­
роятности для единственной неопределенной величины , было бы бессмыс­
ленно говорить, что его распределение “неправильно”. Мы могли бы наде­
яться, что наш испытуемый более хорошо осведомлен о рассматриваемой
величине, но его распределение вероятности только формальное вы раж е­
ние того, что он знает или не знает об этой величине. Мы не можем сказать,
например, что его распределение “слиш ком компактное”, или “слиш ком сво­
бодное, “ или “слиш ком смещено вправо”. Но, в отличие от этого случая,
допустим, что наш испытуемый дает нам ты сячу распределений ты сячи раз­
личны х неопределенных величин. Если каж дое из ф актических истинных
значений должно попадать либо ниж е его соответствующего 0.01 кванти­
л я, либо выш е его 0.99 квантиля, то мы сможем сказать, что он внеш не не
Сообщение о процессе обучения оцениванию... 339
ограничен, что его распределения имеют тенденцию быть слиш ком ком пак­
тными. И ли, напротив, если бы было так, что каж ды й из его оцененных
меж квартильны х диапазонов содержал бы истинную величину, то это обо­
значало бы его тенденцию быть слиш ком разреж енны м. Допустим, что это
экстремальны е случаи, но они устанавливаю т то, что возможно и уместно
говорить о внеш ней валидизации множества распределений вероятности.

Ц ели у п р аж н е н и й и со став гр у п п и сп ы ту ем ы х
Не вдаваясь в подробности, позвольте нам предоставить краткий обзор того,
что мы сделали. Посредством ряда анкет мы опросили большое количество ис­
пытуемых (приблизительно тысячу) и записали их оценочные квантили для
нескольких величин, неизвестных им во время оценки. Затем мы сравнили их
оценки с фактическими истинными значениями; идентифицировали некото­
рые постоянные предубеждения; исследовали формальные процедуры для из­
менения их оценочных входных данных; проинформировали каждого испы­
туемого о качестве ответов группы и его собственного специфического набора
ответов; и, наконец, мы предложили способы, которыми кажды й испытуемый
мог получить информацию о прошлых индивидуальных особенностях и, та­
ким образом, изменить свой последующий набор оценок.
Мы провели четыре отдельных, но связанны х упраж нения в течение ака­
демического года 1968-1969, и для идентификации, перечислим их:
Группа 1: 139 студентов факультативного курса “Модели плани­
рования в условиях неопределенности”, второй курс программы на
степень магистра бизнес-управления (МБУ) Гарвардского универси­
тета.
Группа 2 :8 0 0 студентов, вклю чаю щ ая всех первокурсников про­
граммы МБУ Гарварда.
Группа 3 : 67 “добровольцев” с углубленного курса менеджмента
на бизнес-факультете Гарварда.
Группа 4: 60 студентов, проходящ их курс анализа принятия ре­
ш ений, который осущ ествлялся в аспирантуре точных и гумани­
тарны х наук в Гарварде. Это были студенты различны х ф акульте­
тов в Гарварде и Технологическом институте ш тата Массачусетс и
изучали экономику, статистику, инженерию , математику, юрисп­
руденцию, управление, дизайн, общественные отнош ения, опера­
ционный анализ.
До принятия участия в этом исследовании, все испытуемые в этих четы ­
рех группах изучали основные принципы анализа принятия решений: по­
строение и анализ схем принятия реш ений, предшествующие и последую­
щ ие распределения вероятности, теорию полезности (или предпочтений) и
величину информации.
340 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Н а группе 1 проводилось пилотажное исследование. От каж дого студен­
та требовалось независимо оценить распределения для 20 неопределенных
величин. Д ля этой группы мы изменяли наш и инструкции о вероятности
“хвоста” распределения; это обсуждается позже в этой главе. Все 20 оценок
были проведены за одно испытание без обратной связи.
С группами 2, 3 и 4 было проведено нечто подобное. В первом испытании
каж дом у испытуемому предлагали оценить 10 неопределенных величин.
Затем испытуемых информировали относительно результатов всей группы
и их собственных результатов. Затем осущ ествлялось следующее испы та­
ние с 10 различны ми неопределенными величинами.
Д ействия группы 1 и групп 2, 3 и 4 в первых испы таниях были в значи­
тельной мере сходны. Действия групп 2, 3 и 4 во втором испы тании, после
информирования и обратной связи, были снова чрезвычайно подобны; но
заметные улучш ения были отмечены между их первыми и вторыми испы­
таниям и. И з-за подобия действий всех групп мы обсудим и сделаем замеча­
ния по детальным результатам самой большой из этих групп.

У п р а ж н е н и е и р е зу л ь т а т ы , п о л у ч ен н ы е до о б р атн о й с в я зи
Мы воспроизводим инструкции, которые были предоставлены половине уча­
щ ихся курса МБУ (группа 2). Эта подгруппа получила то, что мы назвали фор­
мой В; другая половина получила форму А, которая была идентична по содер­
жанию , но в которой были приведены другие неопределенные величины.
Инструкции: форма В
Цель этого упражнения состоит в том, чтобы увидеть, насколько хорошо Вы как
представитель группы и группа в целом можете оценивать распределения вероят­
ности для неопределенных величин (НВ). Мы приведем ниж е 10 НВ, и Вас попро­
сят оценить медиану, 0.25 квантиль, 0.75 квантиль и значения экстремума каж ­
дой НВ. (Для вашего удобства краткие определения этих терминов даются ниж е.)
Благодаря типу используемой НВ, Вы сможете сравнить Ваши оценки с истинны­
ми значениями. Таким образом, Вы сможете увидеть, склонны ли Вы делать рас­
пределение “слишком плотным”, “слиш комразреженным” или смещенным вверх
или вниз в определенных типах вопросов. П озж е Вас попросят повторить это уп­
ражнение с другими НВ. Для этого упражнения Вы должны независимо ответить
на вопросы, не просматривая исходные материалы, хотя для некоторых вопросов
желательно произвести простые вычисления. На интересует Ваше знание незави­
симо от того, насколько оно неопределенно или насколько неудобно Вы себя чув­
ствуете.
Определения квантилей...
Н иж е приведено 10 величин, которые, как мы надеемся, для Вас являются
неопределенными. Вы должны записать Вашу оценку на каждом бланке ответа.
Заполните каждый пункт настолько хорошо, насколько Вы можете с нынешними
знаниями, но не ищите дальнейшую информацию и не обсуждайте вопросы о соот­
ветствии со своими партнерами даж е после того, как Вы сдадите свои ответы. Вам
необходимо сдать один бланк ответов перед занятиями завтра, а второй оставьте
Сообщение о процессе обучения оцениванию... 341
себе так, чтобы у Вас была запись Ваших ответов. (Студенты использовали сохра­
ненный экземпляр, чтобы оценить себя. Это будет описано позж е.)

Значения некоторых из переменных будут определены с помощью ответов студентов-


первокурсников на следующие вопросы:

Вопросы
A. Вы предпочитаете бурбон или скотч?
B. Вы одобряете отсрочки от армии для всех аспирантов независимо от области
деятельности?
C. Приняли бы Вы участие в азартной *игре “50 на 50”, где Вы могли бы либо
проиграть $ 50 или выиграть $ 100?

Список неопределенных величин


1. Процент ответов первокурсников (исключая тех, которые вообще не пьют),
предпочитающих бурбон скотчу.
2. Процент ответов первокурсников, которые одобряют отсрочку от армии для
всех аспирантов независимо от области деятельности.
3. Процент ответов первокурсников, которые сыграли бы в азартную игру в воп­
росе С, приведенном выше.
4. Процент респондентов, которые принимали участие в Опросе общественного
мнения института Гэллапа в июле 1968 (рассматривающем репрезентативную вы­
борку взрослых американцев) и выразили мнение, что если начнется полномасш­
табная война на Ближнем Востоке, США должны послать вооруженные формиро­
вания для помощи Израилю.
5. Процент респондентов, участвовавших в опросе общественного мнения в мар­
те 1968 (рассматривающем репрезентативную выборку взрослых американцев),
которые ответили, что учителям государственных школ нужно разрешить вступать
в профсоюзы.
6. Количество терапевтов и хирургов, перечисленных в телефонном справочни­
ке “Ж елтые страницы” Бостона и его окрестностей в 1968.
7. Общее количество студентов, которые в настоящее время зарегистрировалось
в докторской программе бизнес-факультета Гарварда.
8. Полное производство яиц (в млн штук) в США в 1965.
9. Количество иностранных автомобилей, импортированных в США в 1967,
выраженное в тысячах.
10. Пошлина, собранная на Панамском канале в 1967 году, выраженная в мил­
лионах долларов.

(Новая страница)
Форма В (бланк, который нужно сохранить)
Секция____
Номер студента______
П ожалуйста, выберите один ответ для каждого из вопросов А , В и С:
A . Напиток бурбон (1) Скотч (2) Не пью вообще (3)
B. Отсрочка от армии одобряю (1), выступаю против (2)
C. Азартная игра 50-50 принимаю__ (1), отклоняю__ (2)
342 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
П ожалуйста, оцените все 5 величин для каждой из этих 10 переменных, приве­
денных ниж е. Заметьте, что самое высокое число в каждой строке находится спра­
ва. (Десятичные дроби в ответах допускаются. Если необходимо указать процент,
ответы должны иметь форму 97.2 для 97.2% , а не 0 .972.)

Неопределенная величина Квантиль

1. Бурбон (% )...............................(0.01) (0.25) (0.50) (0.75) (0 .9 9 ).

Информационное сообщение об обратной связи

Приблизительно через неделю после того, как студенты заполнили форму В, сту­
дентам был предложена следующее информационное сообщение. Оно обсуждалось
в группе до того, как студентам дали для заполнения форму А.
Цель этого информационного сообщения:
1. Описать в совокупности поведение людей, заполнивших форму В,
2. Указать систематические предубеждения в ответах,
3. Позволить Вам проверить себя прежде, чем Вы повторите это упражнение в
форме А.

Таблица 1. Ответы на вопросы в форме В

Н ом ер Н азвание И ст инное значение


1 Бурбон 42.5
2 Отсрочка от армии 65.5
3 Азартная игра "50 на 50" 55.2
4 Израиль 10.4
5 Профсоюз учителей 63.5
6 Список докторов 2.600
7 Докторанты 235
8 Произведенные яйца (миллионы) 64.558
9 Импортированные автомобили
(тысячи) 697

10 Доход с Панамского канала


(миллионы) 82.3

Как вы помните, для каждого вопроса, Вы оценили пять квантилей: 0 .0 1 ,0 .2 5 ,


0 .5 0 , 0 .7 5 , 0 .99. Эти квантили делят интервал линии на шесть категорий:
Категория 1: Все числа ниж е квантиля 0.01
2: Все числа меж ду 0.01 и 0.25 квантилями
3: Все числа меж ду 0.25 и 0.50 квантилями
4: Все числа меж ду 0.50 и 0.75 квантилями
5: Все числа меж ду 0.75 и 0.99 квантилями
6: Все числа выше 0.99 квантиля.
Сообщение о процессе обучения оцениванию... 343
Для любого из этих десяти вопросов, как только Вы определяете Ваши пять кван­
тилей (или, что то ж е самое, как только Вы определяете эти шесть категорий) следу­
ет указать, в какую категорию попадает фактическая истинная величина. Напри­
мер, студент Джон Доу определил следующие квантили для вопроса о скотче и бур­
боне:
(0.01) (0 .2 5 ) (0 .5 0 ) (0 .7 5 ) (0 .9 9 )
Оценка:
5 15 30 40 45
Фактический процент студентов, одобряющих бурбон, как оказалось, был 42.5;
следовательно, в этом вопросе ответ г-на Доу попадает в категорию 5.
Теперь преж де, чем мы дальше будем обсуждать, как хорошо (или плохо) груп­
па выполнила это упражнение, пожалуйста, обратитесь к вашему бланку ответов и
для каждого вопроса отметьте, какая из ваших шести категорий содержит истин­
ную величину.
В Таблице 1 мы перечислили истинные ответы.

Анализ межквартпилъных диапазонов


Давайте сначала рассмотрим колонки 3 и 4 в Таблице 2. Д ля любого вопроса
Вы долж ны были выбрать 0.25, 0.50, 0.75 квантили так, что, по вашему
мнению, настолько ж е вероятно, что истинный ответ попадет в диапазон от
0.25 до 0.75 (то есть, в категории 3 и 4), к ак если бы он в него не попал. В
общем количестве 1.000 вопросов (100 х 10) мы получили бы (математичес­
кое) ож идание 500 ответов в категориях 3 и 4. Мы получили только 334 та­
ких ответов. Неплохо. Это несоответствие могло быть статистическим от­
клонением, но мы в этом сомневаемся. Н апример, подобный анкетны й оп­
рос нескольких недель назад был предоставлен многочисленной группе вто­
рокурсников МБУ - они ответили на 20 вместо 10 вопросов - и 33% их отве­
тов попали в категории 3 и 4. Мы не хотим сказать, что 33% “универсаль­
ная полуконстанта”, но это довольно поразительное совпадение, которое
стоит учиты вать. (Соответствующий процент для первого заполнения фор­
мы А был 33% ; студенты, занимаю щ иеся углубленным изучением менед­
ж мента (группа 3) такж е выдали число 33% , но студенты ф акультета точ­
ных и гуманитарны х наук (группа 4) предоставили ответ 36% .)
В совокупности, интервалы от 0.25 квантиля до 0 .75 были слиш ком плот­
ными. Столько истинных значений должно было попасть за пределы диапа­
зонов интерквартилей (от 0.25 до 0.75 диапазона), сколько и попасть в них,
но ф актически вдвое больше попало за его пределы, чем внутрь. Но нам это­
го ещ е не достаточно, чтобы говорить, “расш ирьте диапазон интеркварти­
лей”, потому что существует больш ая изменчивость в зависимости от воп­
роса и человека.
Сравним вопросы 1 и 10. В вопросе 1 Вы могли почувствовать, что много
знаете о том, каки е напитки предпочитаю т Ваши одногруппники, по край ­
ней мере, весьма много по сравнению с тем, что Вы знаете относительно до­
ходов от П анамского канала. Поэтому, Вы могли бы почувствовать, что у
Вас есть больш ий ш анс (ожидаемый) захватить в ваш ем интерквартильном
344 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Таблица 2. Распределение ответов испытуемых в форме В по категориям.

0.01 0.25 0 .5 0 0.7 5


Ниже Выше
до до до до
Номер Н азвание 0.01 0 .9 9 всего
0 .2 5 0.50 0.75 0.99
1 Бурбон 3 16 20 40 11 10 100
2 Отсрочка от
армии 15 12 35 19 10 9 100

3 Азартная игра
50-50 11 8 28 29 13 11 100
4 Израиль 51 41 6 1 1 0 100
Профсоюз
5 1 1 13 28 29 28 100
учителей
6 Список докторов 24 14 12 13 10 27 100
7 Докторанты 1 3 11 9 15 61 100
Производство 2 58
8 яиц 9 13 10 8 100
Импортирован­ 15 18 9 26
9 ные машины 25 7 100
10 Доход с канала 18 8 8 12 16 38 100
Всего 158 120 164 170 120 268 1.000
Ожидае­
мая 10 240 250 250 240 10 1.000
частота

диапазоне истинную пропорцию бурбона, чем истинные доходы от П анамс­


кого канала. Но разве так вы должны думать? Если Вы это ож идали, Вы
долж ны были увеличить Ваш м еж квартильны й диапазон для доходов от
П анамского канала. При заполнении формы А убедитесь, что Вы чувствуе­
те, независимо от ваш ей информированности, что:
a. Д ля любого вопроса одинаково вероятно, что истинное значение попа­
дет к ак в м еж квартильны е пределы, так и вне их;
b . Одинаково вероятно, что истинное значение попадет в Ваш м еж квар­
тильны й диапазон д ля вопроса, о котором Вы знаете много и для вопроса, о
котором Вы знаете мало.
(Этот последний пункт относительно вопросов 1 и 10 мы необдуманно об­
судили со студентами ф акультета точных и гуманитарны х наук скорее до,
чем после того, к ак они закончили свой первый круг оценок. Это могло бы
объяснить несоответствие между 33 % и 36% . Мы увидим намного более зна­
чительное изменение, когда посмотрим на вероятности размещ ения “хвос­
та” распределения.)
Н екоторые из Вас действительно производят слиш ком плотные распре­
деления. Н апример, 13 из 100 респондентов охватили только 1 или ни одно­
Сообщение о процессе обучения оцениванию... 345
го истинного значения в своих 10 меж квартильны х диапазонах. Д ля каж ­
дого человека, пусть его межквартпилъное множество будет числом попа­
даний истинны х значений в его меж квартильны е диапазоны. М ножество,
близкое к 0, подразумевает, что человек “слиш ком напряж ен”; множество
близкое к 10 предполагает, что человек “слиш ком свободен”; а множество
около 5 подразумевает, что он - “почти прав”. Распределение множества
приводится в табл.З. В третьей колонке таблице мы перечислили ож идае­
мое количество респондентов, которые бы предоставили любое данное меж-
квартильное множество при упрощающем предположении, что существует
вероятность 0.33, что любой меж квартильны й диапазон содержит истин­
ное значение, и что эти дихотомические ответы являю тся независимыми
для разны х вопросов. Убедитесь, что у вас есть свое меж квартильное мно­
жество.

Таблица 3. Распределение межквартильного множества для формы В

Ожидаемое количест во
М ежеквартальное Ф актическое
человек, использующ их
множество количест во человек
р —0 3 3
0 3 1.9
1 10 9.0
2 22 19.9
3 20 26.1
4 23 22.5
5 11 13.3
6 9 5.5
7 2 1.5
8 0 0.3
9 0 0.0
10 0 0.0
Всего 100 100.0

А нализ экстремумов
Возможно, Вы устанавливаете Ваши квантили 0.01 и 0.99 так, чтобы Вы
были “удивлены ” действительно низким ответом (ответ категории 1) и дей­
ствительно высоким ответом (ответ категории б). В 1.000 вопросах мы дол­
ж ны были “ож идать” в общем 20 таких сюрпризов, 10 слева и 10 справа (см.
табл. 2). Было в общем 426 сюрпризов! Это должно не просто удивить нас, а
ш окировать! Вы можете немного успокоиться, хотя бы потому, что Вы не
столь плохи к ак группа второкурсников (группа 1), о которой мы упомина­
346 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ли. П риблизительно 35 студентов попросили, к ак и Вас, перечислить кван ­
тили 0.01 и 0.99 для 20 вопросов. Они записали 46% сюрпризов - немного
хуж е, чем ваш и 42,6% . Других 35 студентов попросили записать 0.001 и
0.999 квантили и вместо “ож идаемы х” 0,2% сюрпризов они записали 40% .
Д ругих 35 попросили в довольно неопределенных терминах, перечислить
“миним альны е” и “максимальны е” значения - мы действительно не знаем,
что это означает - и они сделали запись 47% сюрпризов. Н аконец других 35
попросили дать “удивительно низкие” и “удивительно высокие” значения,
и они отметили 38% сюрпризов. Очевидно, “удивительнонизко”, ниж е, чем
“минимум”.
Ради Бога, Расширьте свои экстремумные квартилиХ Будьте честными с
самим собой! П ризнайте то, что Вы не знаете!
Рассмотрим 6-й вопрос 2 .6 0 0 докторов в области медицины перечислены
в телефонном справочнике Бостона и его окрестностей. Половина из Вас была
удивлена этим результатом. Некоторые были удивлены тем, что это такая
больш ая цифра, другие, что - маленькая. П ятьдесят восемь процентов были
удивлены фантастически большим количеством произведенных яиц - но все-
таки 9% были одинаково удивлены фантастически маленьким количеством.

Таблица 4. Распределение индексов неожиданности для формы В

Ожидаемое число
Ф актическое
И ндекс неож иданности человек, использующ их
количест во человек
р = ОАЭ
0 1 0.4
1 9 2.7
2 15 9.3
3 13 18.7
4 17 24.6
5 15 22.3
6 16 14.0
7 4 6.0
8 9 1.7
9 1 0.3
10 0 0.0
Всего 100 100.0

Давайте определим для каж дого человека индекс неожиданности, кото­


ры й показы вает количество раз (из 10), когда он делает запись ответа кате­
Сообщение о процессе обучения оцениванию... 347
гории 1 или 6. В среднем по поводу многих различны х, независимых вопро­
сов Вы должны быть удивлены 1 раз из 50. Индексы неожиданности 0 или 1 -
то, что мы хотели бы видеть, и появляется причина для беспокойства, если
индекс неожиданности достигает 3 или больше. Распределение индексов
неожиданности дается в табл. 4. В третьей колонке таблицы мы перечисли­
ли ожидаемое количество испытуемых, которые бы зарегистрировали дан­
ные индексы неожиданности при упрощенном предположении, что суще­
ствует вероятность удивления 0.43 в каж дом вопросе, и вопросы друг на
друга не влияю т. Сорок пять (45) человек были удивлены по крайней мере в
половине из этих десяти вопросов!
Д ля типичной неопределенной величины, мы предположим, что боль­
ш инство из Вас хочет оценить унимодальную кривую плотности (или, что
то ж е самое, совокупное распределение с левым хвостом в форме буквы S),
где сам ая вы сокая точка на кривой плотности (или сам ая крутая часть сово­
купной S-кривой) находится где-то в интервале ваш их квантилей от 0.2 5 до
0.75. Многие из Вас, к ак мы неосторожно полагаем, сделали запись бимо­
дальны х кривы х. Это случилось бы, если длина ваш его интервала катего­
рии 2 меньш е, чем ваш интервал категории 3, а длина вашего интервала
категории 5 - меньш е, чем длина интервала категории 41. Давайте рассмот­
рим следующ ий набор оценок квантиля:

К ван ти л ь:. 0.01 0.25 0.50 0.75 0.99


Оценка: 5. 1 40 15

Д лина категории 10 5 10

Таблица 5. Сравнение результатов в испытаниях 1 и 2

_______ форма А______________ форма В_______


Испытание Испытание Испытание Испытание
__________________________________ 1__________ 2__________ 1__________ 2
Значения, попадающие
внутрь межквартильных 32.9 40.3 33.4 46.4
диапазонов (%)
Значения, не попадающие в
диапазоны от 0.01 до 0.99 38.8 24.9 42.6 22.2
(% )

1 Пусть 1. определяет длину категории 1. Мы имели бы бимодальность, если бы 12; и 15, каж­
дый был бы меньше, чем (13 + 14) /2 .
348 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Таблица 6. Сравнения результатов испытаний 1 и 2
______ Группа 3_____________ Группа 4______
Испытание Испытание Испытание Испытание
__________________________________ 1__________ 2__________ 1__________ 2
Значения, попадающие
внутрь межквартильных 33.4 44.8 35.6 42.5
диапазонов (%)
Значения, не попадающие в
диапазоны от 0.01 до 0.99 35.6 22.8 20.8 8.7
(%)
В выш еупомянутой иллю страции отношение длин вероятностного интер­
вала 0.98 (от квантилей 0.01 до 0.99) к вероятностному интервалу 0.50 (от
квантилей 0.25 до 0.75) равняется (45-5) / (40-15) или 1.6. Это слиш ком м а­
ленькое число для унимодальной кривой. Например, для нормальной пара­
болы это отнош ение - приблизительно 3.5. Отношения от 2.25 до 4.5 могут
служ ить к а к схем атическая директива, но директивы долж ны наруш аться
время от времени. Помните: расш иряйте свои распределения!

Р е з у л ь т а т ы , п о л у ч ен н ы е п о сл е о б р атн о й с в я зи
После обсуждения в группе докладной записки об обратной связи, мы поме­
няли формы и повторили упражнение. После анализа ответов, мы раздали
следующее информационное сообщение:

Информационное сообщение № 2
К аж ды й из Вас уж е принимал участие в следующем:
a. (испытание I): Вам давали одну из двух форм (А или В) и Вы представи­
ли квантиль оценки для десяти неопределенных величин;
b . (обратная связь): Вам дали истинные значения этих десяти квартилей
и попросили записать два фактора: (1) сколько из Ваш их ответов попали в
ваш и интерквартильны е диапазоны , и (2) сколько Ваш их ответов не попа­
ли в ваш и диапазоны 0.01 и 0.99. Вы были такж е информированы об общем
вы полнении работы группой: П риблизительно вдвое больше ответов не по­
пали в интерквартильны е диапазоны , чем попали, и было действительно
ш окирую щ ее число сюрпризов - около 40% ответов попало вне диапазонов
0.01 и 0.99.
c. (И спытание 2): Вам дали другую форму и попросили представить оцен­
к и квантилям .
Мы вы числили Ваши ответы для части (с) и готовы прокомментировать
Вашу совокупную работу. Но, прежде всего, мы перечислим истинные значе­
ния неопределенных величин так, чтобы Вы могли проверить себя (таблица,
представляю щ ая эту информацию, была показана в докладной записке).
Сообщение о процессе обучения оцениванию... 349

Таблица 7. Пропорция неожиданностей для различных интерпретаций


“низко" и “высоко”

И нтерпрета- Пропорция
И нт ерпрет а­
Р азм ер выборки неожидан­
ция "низко" ция "вы соко "
ностей
0.01 квантилями 0.99 квантилями 44 0.46
0.001 квантилями 0.999 квантилями 25 0.40
Минимальное Максимальное 35
значение 0.47
значение
Удивительно Удивительно 35
низко высоко 0.38

Н асколько хорошо группа справилась с этим заданием в целом? Помогла


ли обратная связь? Она помогла, отчасти, но не настолько, насколько мы на­
деялись. Больш инство ваш их распределений слиш ком плотно. В Таблице 5
приведены результаты.
Если мы объединяем формы А и В, то процент попадания истинных ве­
личин в интерквартильны е диапазоны , возрос от 33% до 4 3 % . Намечено
направление изменения, но нам все ж е хотелось бы получить 50% . Процент
непопадания истинных значений в экстремумы значения (то есть, 0.01 и
0.99 диапазонов) снизился от ш окирую щ его 4 1% к угнетающим 2 3 % . Это -
далеко от наш ей цели 2 % . Что-то необходимо сделать с “хвостами” распре­
деления! Мы нуж даемся в другой сессии обратной связи и третьем круге
практики; но, к сожалению , это не выполнимо. Мы предлагаем начать экс­
перименты с другими группами, чтобы получить более реалистические оцен­
ки вероятностей “хвоста” распределения.
(С целью сравнения в табл. 6 показаны действия группы студентов, углуб­
ленно изучающ их менеджмент (группа 3) до и после выполнения, а такж е
поведение студентов факультета точных и гуманитарных наук (группа 4)

Е щ е н ес к о л ь к о сл о в об эк с тр е м у м н ы х “ х в о с т а х ”
В экспериментальном исследовании (группа 1) мы изменили инструкции
относительно экстремумных “хвостов”, чтобы увидеть, какое влияние это
будет иметь на статистические распределения ответов. Всех наш их субъек­
тов, однако, попросили дать медиану оценки и два квартиля. Н аш и резуль­
таты собраны в табл. 7 и 8, которые мы объясним по очереди.
И з 139 испытуемых, сорок четы рех попросили дать 0.01 и 0.99 кванти­
ли, и эта подгруппа зарегистрировала 46% неожиданностей (а не 2% ); 25
попросили дать 0.001 и 0.999 квантили, и эта подгруппа зарегистрировала
40% неожиданностей (а не 0.2% ). Тридцать пять испытуемых попросили
дать “минимальное значение” и “максимальное значение”, и когда некото­
рые испытуемые попросили разъяснить, что эти термины означают, мы ук­
лончиво заметили, что “конечно, это неопределенные термины, но попытай­
тесь ответить на вопросы так или иначе”. Мы дали тот ж е самый неоднознач­
ный совет оставшимся 35 испытуемым, которых спросили относительно “уди­
вительно низких” и “удивительно высоких” значений. Последние две груп­
пы зарегистрировали 47% и 38% соответственно. Различны е инструкции
имели определенное влияние, но, как Вы видите, не очень сильное.

Таблица 8. Распределение “высоких” оценок для вопроса 10


И нт ерпрет ация "высоких оценок "
Очки для Удивительно
победит еля
от 0М 9 М аксим ум
высоко
<29 8 1 в 2
29-35 15 6 7 в
36-42 10 5 7 11
43-49 2 6 5 4
50-56 7 3 8 7
57-63 2 0 2 4
64-70 0 4 0 1
Всего 44 25 35 35

Другим способом исследования влияния этих четырех инструкций на


экстремумы является подробное изучение Таблице 8, которая дает распре­
деление ответов на “высокие” значения для следующей величины: количе­
ство очков победившей команды в следующем футбольном матче Гарвард -
Дартмаут. (Опрос проводили за неделю до игры .) Например, из 25 человек,
которы х попросили дать 0.999 квантиль, 1 сделал запись счета меньш е, чем
2 9 ,6 человек зарегистрировали счет между 29 и 35, 5 человек - между 36 и
42, и так далее. К аж ется, к ак будто неопределенный термин “максимум”
интерпретируется к ак 0.99 квантиль, а неопределенный термин “удивитель­
но высоко “ интерпретируется к ак 0.999 квантиль.
Мы не повторяли в точности эти инструкции относительно экстремум-
ны х значений для групп 2, 3 и 4; а, мы последовательно спросили этих ис­
пы туемы х о 0.01 и 0.99 квантилях.
22. Калибровка вероятностей: положение дел к
1980г.*
*

Сара Лихтенштейн, Барух Фишхофф и


Лоренс Д. Филлипс

С субъективистской точки зрения (de F in etti, 1937/1964), вероятность - сте­


пень веры в утверждение. Она вы раж ает только внутреннее состояние; нет
никакой “правильной”, “верной” или “объективной” вероятности, существу­
ющей где-нибудь “в реальности”, с которой степень веры мож ет быть срав­
нена. Во многих обстоятельствах, однако, возможно проверить правильность
или ошибочность предположения, к которому вероятность бы ла примене­
на. Сегодня, человек оценивает вероятность предполож ения “завтра будет
дождь”. Завтра, смотрит на прибор для измерения осадков, чтобы увидеть
действительно ли ш ел дождь. Если есть возможность, такая проверка мо­
ж ет использоваться для определения адекватности оценок вероятности.
У инклер и Мерфи (W inkler и M urphy, 1968b) идентифицировали два вида
“качественности” оценок вероятности: нормативная качественность, кото­
рое отраж ает степень, в которой оценки вы раж аю т истинные убеждения эк ­
спертов и соответствуют аксиомам теории вероятности, и действительная
качественность, которое отраж ает знания объема темы , представленное в
оценках. В этой главе рассматривается литература о другом аспекте каче­
ственности, называемой калибровкой.
Если человек оценивает вероятность, того что предположение истинно
на 0.7, а позж е обнаруживает, что предположение лож но, это само по себе
не лиш ает оценку валидности. Однако если оцениваю щ ий приписывает ве­
роятность 0.7 на 10.000 независимы х событий, только 25 из которы х впос­
ледствии оказы ваю тся истинны ми, тогда что-то не так с этими оценками.
То, чего им не хватает — калибровки (проверки); другими словами реализ­
ма (Browm и Shuford, 1973), внеш ней валидности, (Brown и Shuford, 1973),

* Это - пересмотренная версия статьи, которая первоначально появилась под редакцией


Н. Jungermann и G. DeZeeuw. Принятие решения и изменения занятий людей. Dordrecht-
Holland: D.Reidel Publishing , Co., 1977. Переиздано в соответствии с разрешением.

* Калибровка - (тех.) это процесс или результат настройки технического устройства для
повышения точности его работы.
352 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
реали зм а уверенности (Adam s и A dam s, 1961), уместности уверенности
(Oskam p, 1962), вторичной валидности (M urphy и W inkler, 1971) и надеж ­
ности (M urphy, 1973). Ф ормально, оцениваю щ ий “проверен”, если, по мно­
гим испы таниям , для всех предположений с заданной вероятностью ,оце­
ненная вероятность равна заданной. К алибровка экспертов может быть оп­
ределена опытным путем, наблю дая их оценки вероятности, проверяя вза­
имосвязанны е предположения, а затем наблю дая пропорцию, истинную в
каж дой категории ответа.
Э кспериментальная литература по калибровке людей, экспертов по ве­
роятности дискретны х предположений, рассмотрена в первом разделе этой
главы . Второй раздел описывает калибровку функций плотности вероятно­
сти, проведенную для неопределенных числовых величин. Х отя калибров­
к а - по сущ еству свойство человека, большинство исследований, рассмот­
ренны х здесь, представляет данны е, сгруппированные по экспертам для
обеспечения большего количества данны х, необходимых для устойчивых
оценок калибровки.

Д и с к р е т н ы е п р ед п о л о ж ен и я
Д искретны е предполож ения могут быть охарактеризованы согласно коли­
честву альтернатив, которые они предлагают:

Безальтернативные: “Что такое абсент?” Эксперт дает ответ, и за­


тем оценивает вероятность того, что данный ответ является правиль­
ны м. Возможен полный диапазон ответов вероятности, от 0 до 1.
Одна альтернатива: “Абсент - это драгоценный кам ень. К акова
вероятность, что это утверж дение является истинны м?” О пять ж е,
возможен диапазон ш калы вероятности - от 0 до 1.
Две альтернативы: “ Абсент - (а) драгоценный камень; (Ь) спирт­
ное”. И спользуя метод неполного диапазона, оцениваю щ ий сначала
выбирает более вероятную альтернативу, а затем заявляет вероятность
(> 0 .5 ) того, что этот выбор является правильны м. И спользуя метод
полного диапазона, оцениваю щ ий определяет вероятность (от 0 до 1),
что данная альтернатива правильна.
Три или больше альтернативы: “Абсент - (а) драгоценный камень;
(Ь) спиртной напиток; (с) карибский остров; ( d ) ...” Могут использо­
ваться две разновидности этой задачи: (1) оцениваю щ ий вы бирает
единственную наиболее вероятную альтернативу и заявляет вероят­
ность, что она является правильной, используя ответ 1 / к для k аль­
тернатив или (2) оцениваю щий назначает вероятности для всех аль­
тернатив, используя диапазон от 0 до 1.
Д ля всех этих разновидностей, калибровка может быть изображена посред­
ством калибровочной кривой. Т акая кри вая получена следующим образом:
Калибровка вероятностей... 353
1. Собирается множество оценок вероятности для пунктов, правиль­
ный ответ по которым известен или будет вскоре известен эксперимен­
татору.
2. Группируются сходные оценки, обычно в пределах диапазонов (на­
пример, все оценки между 0.60 и 0.69 помещены в одну категорию ).
3. В пределах каж дой категории, вы числяется доля правильны х от­
ветов, (то есть, доля пунктов, для которы х предположение истинно,
или альтернатива правильна).
4. Д ля каж дой категории, среднего ответа (по абсциссе) с долей пра­
вильны х ответов (по ординате).
Проведенную калибровку можно показать всеми точкам и, попадающими
на линию идентификации.
Д ля задач с половиной диапазона, плохо калиброванные оценки могут
быть либо самонадеянными, за счет чего исправленные пропорции - мень­
ше, чем оцененные вероятности, и калибровочная кри вая попадает ниж е
линии идентификации, либо неуверенные, за счет чего исправленные про­
порции - больш е, чем оцененные вероятности, и кривая калибровки попа­
дает выш е линии идентификации.
Для задач с полным диапазоном без альтернатив или одной альтернативой,
самонадеянность имеет два возможных значения. Эксперты могли быть само­
надеянными в истинности ответа; такая самонадеянность была бы обозна­
чена кривой калибровки, попадающей всегда ниже линии идентификации. С
другой стороны, эксперты могут быть самонадеянными в их способности отли­
чить истинные предположения от ложных. Такая самонадеянность была бы
показана кривой калибровки ниже линии идентификации в области более чем
0.5 и выше линии идентификации в области ниж е 0.5.
Было предложено несколько числовы х измерений калибровки. Мерфи
(M urphy, 1973) исследовал общий случай пунктов с к альтернативам и, на­
чиная с оценки Байера (B rier, 1950), общее измерения полной качественно­
сти или вероятности оценки, такой, что чем меньш е оценка, тем лучш е.
Оценка Байера (B rier) для N пунктов:

1 N
В = Т7 L (.ri-CiKn-Ci)
™ i= l

Где г. является вектором оцененных вероятностей для k альтернатив пунк­


та i, г , равн яется (г1;..... r ki), а , я в л я е тся связан н ы м вектором исхода,
с., = (с..........с....... ,с..), где с., равняется единице для истинной альтернативы
и нулю в другом случае, а ш трих (‘), обозначает вектор-столбец. Мерфи по­
казал, что оценка Байера может быть разделенана три составные части. Что­
бы это сделать, распределим N векторов ответа на Т подгрупп так, чтобы все
векторы ответа г в подмножестве t являю тся идентичными. Пусть nt, будет
354 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
количество ответов в подмножестве t, и пусть Ct будет вектор исправления
пропорции для подмножества t:

»t
Ct = <сй,......Cjt, .......c h ), где c jt = % c jt / n t

П усть с - вектор доли правильны х ответов для всех,

с - ( с 1>...... c j> ....... с к )* Cj j*

Н аконец, пусть и будет вектор единства (the u n ity vector), вектор строки,
чьи к элементы - все единицы.
Тогда разделение Мерфи оценки Байера:

- ' \ т — — ' \ т — - —
В = с(и - с) + — X nt(rt - ctXrt - ct ) - — £ nt(ct - c \c t - c)
N t=i N t=i

Первое слагаемое - не ф ункция оценок вероятности; скорее, оно отраж ает


относительную частоту истинных событий для к альтернатив. Н апример,
предположим, что все оцениваемые пункты имели одни и те ж е две альтер­
нативы : (дождь, нет дождя). Тогда первое слагаемое - ф ункция базового
значения дож дя для N пунктов (или дней). Если бы всегда (или никогда)
ш ел дож дь, это слагаемое было бы нулевы м. Его максимальное значение,
(к-1)/к, указало бы на максимальную неопределенность относительно воз­
никновения дождя. Второе слагаемое - мера калибровки, оцененное сред­
нее число взятой в квадрат разности между ответами в категории и исправ­
лением пропорции для этой категории. Третье слагаемое, называемое ре­
ш ением, отраж ает способность оценивающего сортировать события в под­
категории, для которых исправление пропорции отличается от полного ис­
правления пропорции.
Разделение Мерфи было предназначено для повторного прогнозирования
того ж е самого набора событий (например, “дождь” вместо “нет дож дя”).
Когда альтернативы не имеют никакого общего значения для всех пунктов
(например, в вопросах с множественным выбором), тогда все, на что указы ­
вает первое слагаемое, это степень, в которой правильны й ответ появляется
одинаково часто как и первая, вторая, и т.д ., альтернатива.
Когда записан только один ответ для одного пункта, разделение Мерфи
(M urphy, 1972) сокращ ается до:
Калибровка вероятностей... 355

- - l J T — 2 1 — - 2
В' = с ([- с ) + — 1 я ( ( г . - с , ) ------ 2 ) л . ( с , - с )
jV <“1 N t=*

Где с - полная доля правильны х ответов и ct - доля правильны х ответов в


подкатегории t. Когда записанные ответы - это ответы, которые больше или
равняю тся 0.5 (как с задачей с двумя альтернативами неполного диапазо­
на), первое слагаемое отраж ает способность субъекта выбрать правильную
альтернативу и , таким образом, могло бы назы ваться знанием. К ак преж ­
де, второе слагаемое измеряет калибровку, а третье - решение.
Подобные измерения калибровки были предложены Адамсами и Оскам-
пом (Adams и A dam s, 1961, Oskamp, 1962). Ни одно из этих измерений к а ­
либровки не различает самонадеянности и неуверенности в себе. Свойства
выборки этих мер не известны.

М етеорологическое исследование
В 1906, В. Эрнест К ук, правительственный астроном в Западной А встра­
лии, вы сказал точку зрения, что каж ды й метеорологический прогноз дол­
жен сопровождаться единственным числом, которое “указы вало бы, при­
близительно, степень вероятности, которую сам метеоролог приписывает
этому предсказанию ” (Cooke, 1906b, с. 274). Он сообщил о результатах 1.951
предсказаний (Cooke, 1906а, 1906b). И з тех, которым он приписал самую
высокую степень вероятности (“почти уверен, что правильно”), 0.985 были
правильны. Д ля средней степени вероятности (“средняя вероятность”), 0.938
были правильны ми, в то время к ак для самой низкой степени вероятности
(“сомнительный”), 0.787 были правильны .
В 1951, У ильямс (W illiam s) попросил восемь профессиональных метео­
рологов в Солт-Лейк-Сити оценить вероятность выпадения осадков для к аж ­
дого из 1 0 9 5 12-часовых прогнозов, используя одно из чисел 0 ,0 .2 ,0 .4 ,0 .6 ,
0.8 и 1.0. Почти по всему диапазону, доля дней с осадками бы ла ниж е, чем
приписанная вероятность. Это могло бы отраж ать довольно естественную
форму перестраховки в публичных утверж дениях. Лю ди, намного более
вероятно, будут критиковать прогноз погоды, который оставит их в дождь
без зонтика, чем прогноз, прислуш авш ись к которому они носили зонтик в
дни без осадков.
Подобные результаты показало исследование Мерфи и У инклера (M urphy
и W inkler, 1974). Их метеорологи дваж ды оценили вероятность вы падения
осадков на следующий день, к ак до, так и после наблю дения результатов
компью теризированной системы предсказания погоды (PEATMOS). Эти
7.188 оценок (как до, так и после PEATMOS) показали ту ж е самую пере­
оценку вероятности дож дя, обнаруженную Уильямсом (W illiam s).
Сандерс (Sanders, 1958) собрал 12.635 прогнозов, используя 11 ответов 0,
0 .1 ,..., 0 .9 ,1 .0 , для следующих дихотомизированных событий: направление
356 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ветра, скорость ветра, порывы, температуры, облачность, высота облачнос­
ти, видимость, выпадение осадков, тип осадков и гроза. Эти данные показали
только небольшую тенденцию оценок вероятности синоптиками превыш ать
пропорцию погодных событий, которые произош ли.1 Рут (Root, 1962) сооб­
щ ил о симметричности калибровки 4.138 прогнозов осадков: приписанные
вероятности были слиш ком низки в низком диапазоне и слиш ком высоки в
высоком, относительно наблюдаемых частот.
У инклер и Мерфи (W inkler и M urphy, 1968а) сообщили о калибровоч­
ны х кривы х за год прогнозов осадков в Хартфорде, ш тат Коннектикут. К аж ­
ды й прогноз был либо для 6-часового, либо 12-часового периода времени, с
временем подготовки от 5 до 44 часов. К сожалению , было неясно, вклю чи­
ли ли синоптики “признаки осадков” (меньше чем 0.01 дюйма) в свои пред­
сказания. Данные были проанализированы дважды, предполагая, что “осад­
к и ” вклю чаю т или не вклю чаю т признаки. Вклю чение или исклю чение
признаков имело существенное влияние на калибровку, к ак и временной
период. 6-часовые прогнозы с признакам и и 12-часовые прогнозы, и без при­
знаков, показали превосходную калибровку. К ривая калибровки для 12-
часовы х прогнозов с признакам и располагается выш е линии идентифика­
ции; кри вая для 6-часовых прогнозов, без признаков, леж ит значительно
ниж е ее. Разница во времени подготовки не затрагивала калибровку.

Рис. 1. Данные калибровки для прогнозов осадков. Количество про­


гнозов показано для каж дой точки. ( Источник : M urphy и W inkler,
1977а.)

1 Ссылки на Кук (Cooke ,1906), Вилльямс (Williams, 1951) и Сандерс (Sanders, 1958) были
предоставлены нашему вниманию Раиффом (1969).
Калибровка вероятностей... 357
Н ациональная метеорологическая служ ба вы раж ает свои прогнозы воз­
никновения осадков в вероятностных терминах, начиная с 1965. Бы ла опуб­
ликована калибровка для некоторых частей этой массивной базы данных
(M urphy и W inkler, 1977а; А мериканское метеорологическое бюро, 1969).
За эти годы калибровка улучш илась. Рисунок 1 показы вает калибровку для
24.859 прогнозов осадков, сделанных в Ч икаго в течение четы рех лет, за­
канчивая июнем 1976. Он показы вает очень хорошую калибровку; Мерфи
(M urphy, 1980) утверждает, что данные, полученныев течение недавних лет,
даже лучше! Он приписывает лучш ее выполнение работы опыту в оценке
вероятности, которы й синоптики приобрели за эти годы, а такж е тому ф ак­
ту, что эти данные были собраны на реальной ситуации на рабочем месте.

Ранние лабораторные исследования


В 1957 Адамс (Adams) сообщил о калибровке испытуемых, которые исполь­
зовали 11-ти бальную ш калу уверенности: испытуемых “попросили вы ра­
зить свою уверенность в терминах процента ответов, сделанных на опреде­
ленном уровне уверенности, которые, к ак они ожидаю т, будут правильны ­
ми. ... И з ответов, сделанных с уверенностью р, приблизительно р% долж ­
ны быть правильны ми” (с. 432-433).
В задаче А дамса, каж дое из 40 слов было представлено с помощью тахи-
стоскопа 10 испытуемым 10 раз подряд, каж ды й раз с более ярким освещ е­
нием. После каж дого показа каж ды й испытуемый записы вал, что по его
мнению, он видел и давал оценку уверенности. Результирую щ ая кривая
калибровки показала, что пропорции, которые были правильны ми, значи­
тельно превы ш али оценки уверенности по полному диапазону ответов (кро­
ме ответов 100). И нтерпретация этих данны х долж на производится очень
осторожно: поскольку каж дое слово показы вали 10 раз, ответы сильно вза­
имозависимы. Неизвестно, какое влияние такая взаимозависимость оказы ­
вает на калибровку. Испытуемые, возможно, хотели “сдерж аться” при пер­
вых показах слова, не ж елая давать вы соких ответов, когда они знали, что
это ж е слово будет представлено ещ е несколько раз.
В следующем году, Адамс и Адамс (Adams и A dam s, 1958) сообщили об
обучающем эксперименте, используя ту ж е ш калу ответов, но новую, трех­
альтернативную задачу с единственным ответом: Д ля каж дой из 156 пар
слов запоказ, испытуемых спраш ивали, были ли слова антонимами, синони­
мами или несвязанны ми._Средние калибровочные оценки (основанные на
абсолютной разности [rt- c ]), у 14 испытуемых экспериментальной груп­
пы, которым были показаны числа и кривы е калибровки после каж дого из
пяти показов, уменьш илась на 48% от первого серии к последней. Ш есть
испытуемых контрольной группы , единственной обратной связью которых
был список их не засчитанных ответов, показали среднее увеличение на 36 %
в оценках несоответствия.
358 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Адамс и Адамс (Adams и A dam s, 1961) обсуждали много аспектов калиб­
ровки (используя термин: реализм уверенности), предвосхищ ая много р а­
боты, сделанной другими, в недавние годы, и представили большее количе­
ство сведений, вклю чая чрезвычайно самонадеянную кривую калибровки
ш изоф реника, который полагал, что он Иисус Христос. В задаче изучения
бессмысленных слогов они обнаружили большую самоуверенность в пер­
вом испы тании и улучш ение после 16 испытаний. Они такж е кратко описа­
ли процедуру эксперимента: в первый день испытуемые приняли 108 реш е­
ний по поводу процента синих точек в последовательности синих и красны х
точек. Н а второй и четверты й день испытуемые определяли истинность или
лож ность 250 утверж дений на общеобразовательные темы. На третий день
они с завязанны м и глазам и поднимали предметы, чтобы определить их вес.
Н а пяты й день они приняли 256 реш ений по поводу отнош ения между п а­
рами слов (синонимия, антонимия или отсутствие отнош ения). Восемь ис­
пытуемых экспериментальной группы, которым предлагали обратную связь
калибровки по истечению каж дого из первы х четы рех дней, на пяты й день
показы вали среднее абсолютное значение несоответствия, которое было зна­
чимо ниж е, чем у 8 испытуемых контрольной группы (без обратной связи),
предполагаю щ ее некоторый трансфер обучения. Н аконец, авторы сообщи­
ли, что для 56 испы туемы х, сдаю щ их экзамен по элементарной психологии
с множественным выбором, более плохая калибровка была связана с боль­
ш им страхом неудачи (г=0.36). К страху неудачи не имели отнош ения ни
наличие знаний, ни самонадеянность.
Оскамп (1962) предъявлял испытуемым 2 0 0 профилей MMPI2в качестве
стимула. Половина этих профилей принадлеж ала лю дям, приняты х в боль­
ницу управления ветеранов с психическими болезнями; остальные попали
туда по чисто медицинским причинам. Задачей испытуемых было опреде­
лить, для каж дого профиля, имел ли пациент психическое или медицинс­
кое заболевание, и указать вероятность того, что их реш ение было правиль­
ны м. К аж ды й профиль был охарактеризован к ак трудный (61), средний (88)
или легкий (51) на основе статистически полученной классиф икации, кото­
р ая различала 57% , 69% и 92% трудны х, средних и легких профилей, со­
ответственно.
Все 2 0 0 профилей были оценены тремя группами испытуемых: 28 старш е­
курсников, специализирую щ ихся в психологии, 23 стажера-психолога в кли­
нике и 21 опытный клинический психолог. 28 неопытных испытуемых были
позж е разбиты на две согласованные группы, и им снова дали те ж е самые
200 профилей. Половину и з них обучили в течение второго испы тания, как
улучш ить точность; остальных обучили, как улучш ить калибровку.
Оскамп (Oskamp) использовал три измерения вы полнения работы испы ­
туемы х: точность (исправление пропорции), уверенность (средний ответ

2Профиль MMPI (Minnesota Multiphasic Personality Inventory) - представленные в виде гра­


фика данные обследования по Миннесотскому Многофакторному Личностному опросни­
ку.
Калибровка вероятностей... 359
вероятности), и правильность уверенности (счет калибровки):

L nt \ rt ~ ct 1.
^ y

Все три группы имели тенденцию быть самонадеянными, особенно старш е­


курсники в первом испы тании (точность 70% , уверенность 0.78). Однако
все три группы были неуверенными в себе в легких профилях (точность 87% ,
уверенность 0.83).
Испытуемые, обученные улучшению точности, увеличили свою точность
от 67% до 73% , приближивш ись к их уровню уверенности 0.78, который не
изменился в результате обучения.3 Субъекты, обученные калибровке, пони­
зили свою уверенность от 0.78 до 0.74, приблизив ее к своей точности 68% ,
которая осталась неизменной. К ак и ожидалось от этих изменений, оценка
калибровки обеих групп улучш илась.

И сследование обнаруж ения сигнала


На ранних стадиях исследования обнаруж ения сигнала, исследователи изу­
чили возможность использования скорее оценок уверенности, чем ответов
да-нет, чтобы уменьш ить количество данны х, требуемых для определения
стабильных кривы х операционных характеристик приемника (ОХП). Свит,
Таннер и Бедсалл (Sw ets, Tanner, и B irdsall, 1961) попросили, чтобы четыре
наблю дателя указали свою уверенность в том, что они слыш али сигнал плюс
ш ум, а не просто ш ум, для каждого из 1.200 испы таний. Х отя трое из четы ­
рех испытуемых были сильно калиброваны , все кривы е очень различались.
Один испытуемый показал серьезную тенденцию назначать слиш ком м а­
ленькие вероятности (например, сигнал присутствовал более, чем в 70% раз,
когда этот субъект использовал категорию ответа “ 0.05-0.19”).
К ларк (C larke, 1960) предъявил одно из пяти различны х слов, смеш ан­
ны х с ш умом, слуш ателям через науш ники. Слуш атели выбрали слово,
которое, к ак они думали, они слыш али и затем оценивали свою уверенность,
указы вая одну из 5 категорий, которые разделяли ш калу вероятности на
пять диапазонов. После каж дого из 12 практических испы таний 75 пунк­
тов, слуш атели записы вали свои собственные результаты и отмечали про­
цент правильны х идентификаций в каж дой категории оценки, таким обра­
зом, они могли менять стратегию на следующем испы тании. К ларк (Clarke)
обнаружил, что, хотя все пять слуш ателей оказались хорошо калиброван­
ными, когда данные были усреднены по пяти словам стимула, анализ от­
дельных слов показал, что слуш атели имели тенденцию быть самонадеян­

3Любители MMPI могли бы обратить внимание, что с этим минимальным обучением стар­
шекурсники показали столь же высокую точность как лучшие эксперты или лучшие систе­
мы прогнозирования.
360 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ными для плохо понятных слов и неуверенными для хорошо понятных слов.
П оллак и Декер (Pollack и Decker, 1958) использовали устно определен­
ную 6-ти бальную ш калу уверенности, от “Я уверен, что я получил сообще­
ние правильно” до “Я уверен, что я получил сообщение неправильно. ” С этой
ш калой оценки невозможно определить, хорошо ли калиброван индивиду­
ум, но возможно увидеть изменения в калибровке во всех условиях. Кривые
калибровки для легких слов обычно леж ат выше кривы х калибровки для
трудных слов, независимо от отношения “сигнал-пгум”, и кривы е для высо­
ких значений отношения “сигнал-ш ум” леж ат выше кривы х для низких зна­
чений отнош ения “сигнал-ш ум”, независимо от трудности слова.
В больш инстве этих исследований, калибровка мало интересовала иссле­
дователей; важ ны м вопросом было то, не дадут ли оценки уверенности те
ж е самые кривы е ОХП что процедуры “да-нет”. К 1966, Грин и Свите (Green
& Sw ets) заклю чили, что ш калы оценок и процедуры “да-нет” дают почти
идентичны е кривы е ОХП. С тех пор, исследования калибровки исчезли из
литературы по обнаружению сигнала.

Н едавнее лабораторное исследование


Чрезмерная уверенность. Наиболее важ ное откры тие в недавнем исследо­
вании - то, что люди являю тся самонадеянными в общеобразовательных
вопросах умеренной или повыш енной трудности. Некоторые типичны е ре­
зультаты , показы ваю щ ие самонадеянность представлены на рис. 2. Х азард
и Петерсон (H azard & P eterson, 1973) попросили 40 служ ащ их вооружен­
ны х сил, обучаю щ ихся в Ш коле внеш ней разведки, определить вероятность
или ш ансы д л я 50 вопросов по общей осведомленности, имеющим две аль­
тернативы (например, “Какой ж урнал имел самый большой тираж в 1970,
Плейбой или Тайм?”). Л ихтенш тейн (L ichtenstein, неопубликовано) полу­
чил подобные результаты , используя те ж е самые пункты , но только для 19
служ ащ их научно-исследовательского института ш тата Орегон, такж е, к ак
Ф иллипс и Райт (P hillips, W rig h t, 1977) с различны ми пунктам и, исполь­
зуя Британских старш екурсников в качестве испытуемых.
Другие многочисленные исследования, использующ ие вопросы на общие
тем ы , п о к а за л и ту ж е сам ую сам о н ад еян н о сть (F isc h h o ff, S lovic и
L ich ten stein , 1977; K o riat, L ichtenstein и Fischhoff, 1980; L ichtenstein и
F ischhoff, 1 9 7 7 ,1980а, 1980b; N ickerson и M cGoldrick, 1965). Кембридж и
Ш рекенгост (Cam bridge, Shreckengost, 1978) обнаружили самонадеянность
у аналитиков Ц ентральной спецслужбы. Ф ишхофф и Словик (Fischhoff и
Slovic, 1980) обнаруж или серьезную самонадеянность, используя множе­
ство невозмож ны х или почти невозможных задач (например, прогнозиро­
вание победителя в скачках на полтора километра или диагноз злокачествен­
ности опухоли). П итц (P itz, 1974) сообщил о самонадеянности, используя
метод полного диапазона.
Калибровка вероятностей... 361

Рис. 2. К алибровка для половины диапазона для пунктов на общее


знание

Фишхофф, Словик и Лихтенш тейн (Fischhoff, Slovic и L ichtenstein, 1977)


сосредоточились на правильности вы раж ения уверенности. И спользуя раз­
нообразные методы (без альтернатив, одна альтернатива и две альтернати­
вы для половины диапазона и с полным диапазоном), они обнаружили, что
только от 72% до 83% пунктов, на которые были даны ответы 1.0, были
правильными. В задачах с полным диапазоном, пункты , которым был при­
писан другой экстремальный ответ, нуль, были правильными от 20% до 30%
раз. И спользование вероятностного ответа не исправляло самонадеянность.
Ответы, которым назначили вероятность 1.000:1 в том, что они правиль­
ные, только от 81% до 88% были правильными; для вероятности 1.000.000:1
правильная альтернатива была выбрана только от 90% до 96% раз. И спы­
туемые охотно использовали экстремумную вероятность; в одном из экспе­
риментов почти четвертая часть ответов бы ла 1.000:1 или больше. Далее ис­
следования показали, что чрезвы чайная самонадеянность распространялась
не только на нескольких испытуемых или несколько пунктов.
Влияние трудности. Самонадеянность наибольш ая в задачах большой
трудности (Clarke, 1960; N ickerson и M cGoldrick, 1965; P itz, 1974). При рас­
смотрении невозможных задач (различить европейский и ам ериканский
профиль, рисунки азиатских и европейских детей, рост и падение цен на
362 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
акции) кривы е калибровки не повыш ались вообще; для всех оцененных ве­
роятностей, доля правильно вы бранны х альтернатив бы ла близка к 0.5
(L ichtenstein и Fischhoff, 1977). Испытуемые не отказывались использовать
вы сокие вероятности в этих задачах; от 70% до80% всех ответов были боль­
ш е 0.5.
По мере того, к а к задачи становятся легче, самонадеянность уменьш ает­
ся. Л ихтенш тейн и Фишхофф (L ichtenstein и Fischhoff, 1977) позволили
одной группе испытуемых в задаче различения профиля изучить правиль­
но помеченный набор типовых стимулов перед оцениванием вероятности.
Этот опыт сделал задачу намного более легкой (71% , правильны х ответов
против 51% для контрольной группы) и экспериментальная группа была
лиш ь немного самонадеянна. Л ихтенш тейн и Ф ишхофф (1977) выполнили
последующий анализ влияния трудности на калибровку, используя две боль­
ш ие совокупности данны х и з двуальтернативны х задач для половины диа­
пазона на общие темы. Они отделили легкие пункты (для которых большин­
ство испытуемых выбрало правильную альтернативу) от трудных, и хоро­
ш о осведомленных испытуемых (тех, которые выбрали наиболее правиль­
ные альтернативы ) от менее осведомленных. Они обнаружили системати­
ческое уменьш ение самонадеянности с увеличением процента правильны х
ответов. Действительно, хорошо осведомленные испытуемые при ответе на
самые легкие пункты были неуверены в себе (например, 90% правильны х
ответов при ответе с вероятностью 0.80). А находка бы ла повторно обнару­
ж ена с двумя новыми группами испытуемых, которым были предложены
наборы вопросов, выбранных, к ак трудные или легкие на основе ответов
предыдущ ихгрупп. Результирую щ ие кривы е калибровки показаны на Ри­
сунке 3, наряду с соответствующими кривы м и калибровки последующего
анализа.
В упомянутом исследовании трудность была определена н а основе отве­
тов испытуемых (Clarke, I960; L ichtenstein и Fischhoff, 1977). Ранее, Лих-
ненш тейн и Фишхофф (L ichtenstein и F ischhoff, 1980а), после О скампа
(Oskam p, 1962), разработали набор из 500 двух-альтернативны х вопросов
на общ ие темы , трудность которы х м огла бы ть определена независимо.
Имелось три типа вопросов: какой из двух городов, ш татов, стран или кон­
тинентов является более густонаселенным (например, Лас Вегас или М айа­
ми), какой из двух городов находится дальш е на расстоянии от третьего го­
рода (например, “Н аходится ли М ельбурн дальш е от Рим а или от Токио?”),
и какое историческое событие произош ло первым (например, подписание
В еликой хартии вольностей или рождение М ухаммеда). Таким образом,
каж ды й вопрос связы вал два числа (население, расстояние или прошедшее
время с настоящ ем). Отношение большего к меньшему из этих чисел было
принято как мера трудности: 250 вопросов с самыми больш ими отношени­
ям и были обозначены к ак легкие", оставш иеся — к ак трудные. Эта априор­
н ая классиф икация была весьма успеш на; для более чем 35 испытуемых,
процент правильны х ответов составил 81 для легких вопросов и 58 - для
Калибровка вероятностей... 363
трудных. Эти результаты , такж е, показали самонадеянность для трудных
вопросов и неуверенность испытуемых для легких.
Влияние легкости или трудности, каж ется, является результатом неспо­
собности экспертов понять, насколько вопрос трудный или легкий.
Ф иллипс и Ч у (P hillips, Chew, не опубликовано) не обнаружили корре­
ляции между процентом правильны х ответов и оценками трудности по 11-
ти бальной ш кале. Однако испытуемые дают различны е распределения от­
ветов д л я различны х задач; Л ихтенш тейн и Ф иш хофф (L ich ten stein и
Fischhoff, 1977) отметили корреляцию в 0.91 между процентом правиль­
ных ответов и средним ответом для 16 различны х наборов данных. Но раз­
ница в распределении ответов - меньш е чем, она долж на быть: по тем те ж е
16 наборам данных, доля правильны х ответов варьировалась от 0.43 до 0.92,
в то время к ак средний ответ, варьировался только от 0.65 до 0.86.

Ответы испытуемых

Рис. 3. Калибровка для трудных и легких тестов и для трудных и


легких заданий тестов
364 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Ф еррелл и МакГоу (Ferrell и McGoey, 1980) недавно разработали модель для
калибровки дискретных оценок вероятности, которая учитывает эффект лег­
кости - трудности. Модель, основанная на теории обнаружения сигнала, пред­
полагает, что эксперты преобразовывают свое чувство субъективной неопреде­
ленности в переменную решения, X , которая разделена на секции с границами
{ x j. Оценивающий сообщает о вероятности г , всякий раз, когда X находится
между хи и х . Феррелл и МакГоу (Ferrell и McGoey) предполагают, что, при
отсутствии обратной связи о действии калибровки, оценивающий не будет из­
менять набор значений пределов, {х.}, по мере того, как изменяется трудность
задачи. Это предположение ведет к прогнозированию самонадеянности в труд­
ны х вопросах и неуверенности в легких. Применение модели к большому ко­
личеству данных из работ Лихтенш тейна и Фишхоффа (1977) показало соот­
ветствие к ак по кривым калибровки, так и по распределению ответов согласно
предположению, что значения пределов остались постоянными по мере изме­
нения трудности. Таким образом, влияние трудности или легкости рассматри­
вается как неспособность изменить пределы, вовлеченные в преобразование от
чувства определенности к вероятностным ответам.
Влияние базового значения. Одно-альтернативные (истина-ложь) задачи мо­
гут быть охарактеризованы долей истинны х утверждений в наборе вопро­
сов. Чтобы быть хорош о калиброванны м на некотором наборе вопросов,
нуж но принимать во внимание информацию базового значения. Модель об­
наруж ения сигнала Ф еррелла и М акГоу (F errell и McGoey, 1980) предпола­
гает, что на калибровку воздействуют независимо (а) доля истинны х утвер­
ж дений и (Ь) способность оценивающего различать истинные утверж дения
от лож ны х. Д опуская, что значения границ {х4}, остаются постоянными, мо­
дель прогнозирует различны е воздействия на калибровку в зависимости от
изменения доли истинных утверждений (оставив различимость постоянной)
в отличие от изменения различимости (оставляя постоянной пропорцию ис­
тинны х утверж дений). Ф еррелл и М акГоу (F errell и McGoey) представили
данны е, подтверждаю щ ие их модель. Студенты на трех курсах, изучаю щ ие
технические науки оценили вероятность, что ответы, которые они написа­
ли на экзам енах, будут оценены экзаменатором к ак правильны е. Последу­
ющ ий анализ, распределяю щ ий испытуемых на четы ре группы (высокий
или низкий процент правильны х ответов, вы сокая или н и зкая различи­
м ость), п о к азал р азл и ч и я к али б ровки , спрогнозированны е моделью .
Н еопубликованные данные, собранные Фишхоффом и Лихтенш тейном, по­
казанны е на Рисунке 4, такж е подтверждают правильность модели. Ч еты ­
ре группы испытуемых получили 25 одно-альтернативных вопросов на об­
щ ие темы (например, “Н аписана ли Энеида Гомером?”), различаю щ иеся по
количеству истинны х утверждений: 8% , 20% , 50% и 71% . Группы показа­
ли сильно различаю щ ие кривы е калибровки, приблизительно той ж е фор­
мы к ак спрогнозировали Ф еррелл и МакГоу для изменения базового значе­
н и я, при постоянной различимости.
Калибровка вероятностей... 365

Ответы испытуемых
Рис. 4. Влияние на калибровку изменений в проценте истинных ут­
верждений (.Источник: Fischhoff и L ichtenstein, неопубликовано)

Индивидуальные различия . Н еквалифицированны е утверж дения, что


один человек лучш е калиброван, чем другой, трудно сделать по двум при­
чинам. Во-первых, необходимо, по крайней мере, несколько сотен ответов,
чтобы получить стабильное измерение калибровки. Во-вторых, оказы вает­
ся, что калибровка сильно зависит от задачи, особенно от ее трудности. Дей­
ствительно, Лихтенш тейн и Ф ишхофф (1980а) предполагали, что для к аж ­
дого человека мож ет существовать “идеальная” задача (то есть, задача, уро­
вень трудности которой не приводит ни к самонадеянности, ни к неуверен­
ности в себе, и таким образом, задача, в которой человек будет наилучш им
образом калиброван). Однако, уровень трудности “идеальной” задачи мо­
жет быть разны м для разны х людей. Таким образом, даж е, когда один че­
ловек лучш е, чем другой в некотором наборе вопросов, для более трудного
или легкого набора мож ет быть истинным обратное.
Сравнения между различны ми группами субъектов показали мало раз­
личий, когда трудность управлялась. Аспиранты-психологи, которые, пред­
положительно, более осведомлены, чем обычные испытуемые (старш екур­
сники, которые ответили на объявление в газете колледж а), не показали ни­
какой разницы в калибровке (L ichtenstein и Fischhoff, 1977). И при этом
мы не обнаружили различия в калибровке или самонадеянности между муж ­
чинами и ж енщ инами (L ichtenstein и Fischhoff, 1981).
Райт и Ф иллипс (1976) исследовали отношения среди нескольких измере­
ний качеств личности (авторитаризм, консерватизм, догматизм и нетерпи­
366 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
мость к двусмысленности), вербальные выражения неопределенности (напри­
мер, количество слов таких, к ак маловероятно, использованных в коротких
письменных ответах на 45 вопросов), и несколько измерений калибровки.
Единственные связи, которые они обнаружили между шестью ш калами лич­
ности и семью измерениями калибровки, были две скромные корреляции
(0.41 и 0.34) со ш калой авторитаризма. Калибровка ответов определенности
(то есть, ответы 1.0) не коррелировала с калибровкой ответов неопределенно­
сти (< 1.0). И змерения вербальной неопределенности были некоррелирова-
ны с любым из числовых измерений калибровки. Авторы заклю чили, что ве­
роятностное мыш ление не является ни единственным фактором, ни сильно
связанным с индивидуальными различиями качеств личности.
Райт и другие (1978) исследовали межкультурные различия в калибров­
ке. Калибровка их британской выборки показана на рис. 2 (обозначенная как
Phillips и W right, 1977). Их другими выборками были студенты из Гонконга,
Индонезии и М алайзии. Азиатские группы показали по существу плоские
кривы е калибровки. Авторы реш или, что азиатские философы, интересую­
щ иеся вопросами судьбы, могли бы объяснить эти различия.
Попытки коррекции. Фишхофф и Словик (Fischhoff и Slovic, 1980) про­
бовали предотвратить появление самонадеянности на задаче различения ри­
сунков азиатских от европейских детей, используя явно обескураживающие
инструкции:
Все рисунки были взяты из Детской художественной коллекции доктора Роды Келлогг
(Rhoda Kellogg), главного сторонника теории, что рисунки детей из разных стран и куль­
тур очень похожи.... Помните, что может быть совершенно невозможно различить эти
рисунки. Сделайте все, что в ваших силах. Но если, в крайнем случае, Вы чувствуете
полную неопределенность относительно происхождения этих рисунков, не смущайтесь
отвечать0.5 для каждого из них. (с. 792)

Эти инструкции понизили средний ответ примерно до 0.05, но тем не менее


была обнаружена существенная самонадеянность.
Улучшит ли калибровку усиление мотивации? Сибер (Sieber, 1974) сравнил
калибровку двух групп студентов на связанных с курсом набором вопросов с че­
тырьмя альтернативами. Одной группе сказали, что они сдают экзамен в конце
семестра. Другой группе было представлено не как экзамен в конце семестра, а
как подготовка к нему. Эти две группы не отличались по числу выбранных пра­
вильных альтернатив, но предположительно более мотивированная группа (та,
в которой ответы определяют их уровень) показала значимо худшую калибров­
ку (большую самонадеянность).
Обученные эксперты, с обратной связью о калибровке, показали смешанные
результаты. Как упомянуто, Адамс и Адамс (1958) обнаружили незначительное
улучш ения к ачес тва калибровки после пяти сессий обучения и , в более позднем
исследовании (1961) наблюдалась некоторая генерализация обучения. Чу (Choo,
1976), используя только одну сессию обучения с 75 двух-альтернативными воп­
росами на общие темы, обнаружил малое улучшение и никакой генерализации.
Калибровка вероятностей... 367
Лихтенш тейн и Фишхофф (1980b) обучили две группы испытуемых пу­
тем предоставления обширной, персонифицированной обратной связи калиб­
ровки после каж дой 2-й или 10-й серии вопросов, составленных из 200 двух­
альтернативных вопросов на общие темы. Они обнаружили заметное улуч­
ш ение калибровки, которая произош ла между первой и второй сериями.
Скромная генерализация произош ла для задач с различными уровнями труд­
ности, содержанием и способом ответа (четыре, а не две альтернативы), не
было обнаружено никакого улучш ения для задачи оценки квантиля (опи­
санной в следующей главе) или различения европейского от американского
образцов профиля.
Другой подход к улучшению калибровки - это реструктурировать задачу
таким способом, который препятствует появлению самонадеянности. В ис­
следовании Кориата, Л ихтенш тейна и Ф иш хоффа (K oriat, L ichtenstein и
Fischhoff, 1980), испытуемые сначала отвечали на 30 двух-альтернативных
вопросов на общие темы обычным способом. Затем они получили 10 дополни­
тельных вопросов. Д ля каждого вопроса они записали все причины, которые
они могли придумать, в поддержку или опровержение каждому из двух воз­
можных ответов, а затем сделали обычный выбор и оценки вероятности. Эта
процедура значительно улучш ила их калибровку. Дополнительное исследо­
вание помогло точно определить эффективный компонент этого метода. Пос­
ле ответа на начальный набор из 30 вопросов, испытуемым предлагали еще
30 вопросов. Д ля каждого, они сначала выбрали предпочтительный ответ,
затем писали (а) причину, поддерживающую их выбранный ответ, (Ь) причи­
ну, противоречащую выбранному ответу или (с) две причины, одну в поддер­
ж ку и одну в опровержение. Затем они оценили вероятность, что выбранный
ответ был правилен. Только та группа, которую попросили написать опро­
верж ения, показала улучшенную калибровку. Этот результат, такж е как
исследования корреляции, основываясь на данных от первого исследования,
говорит о том, что эффективным средством от самонадеянности является по­
иск причины, почему человек не прав.
Экспертиза. Студенты, изучающ ие в колледже определенный предмет,
являю тся экспертами, по крайней мере, временно, в материале темы предме­
та. Сибер (Sieber, 1974) сообщил о превосходной калибровке у студентов, сда­
ющих пробный экзамен (то есть, у группы студентов, которым сказали, что
это не экзамен). Более чем 98% их ответов с вероятностью 1.0 и только 0.5%
из их ответов с вероятностью 0 были правильными. П иц (P itz, 1974) попро­
сил студентов сделать прогноз своих оценок на его курсе; они такж е были
хорошо калиброваны.
Бы ли ли бы эти испытуемые так ж е калиброваны на вопросах эквивален­
тной трудности, которые не были в их области изучения? Лихтенш тейн и
Фишхофф (1977) попросили аспирантов-психологов ответить на 50 двух-аль-
тернативных вопросов на общие темы и на 50 вопросов, охватывающих зна­
ния по психологии (например, “тест И ш ихара - это (а) перцептивный тест,
368 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
(Ь) тест социального беспокойства”). Два субтеста имели равную трудность, и
калибровка была одинаковой для этих двух задач.
Кристенсен-Сзалански и Бушихед (Christensen-Szalanski и Bushyhead, 1981)
сообщили об оценках вероятности пневмонии девяти врачей для 1.531 пациен­
тов, которые были обследованы из-за жалоб на каш ель. Их калибровка была
уж асна; кривая повышалась настолько медленно, что для самого высокого
уровня уверенности (приблизительно 0.88) доля пациентов, фактически боль­
ных пневмонией, была меньше чем 0.20. О подобных результатах было сооб­
щено Ластедом (Lusted, 1977) для диагнозов перелома черепа и пневмонии, и
ДеСметом, Фрайбеком и Торнбери и для диагнозов перелома черепа (DeSmet,
Fryback, и Thom bury, 1979). Результаты этих полевых исследований с врача­
ми четко противоречат превосходной калибровке прогнозов погоды метеоро­
логами. Мы считаем, что несколько факторов благоприятствуют синоптикам.
Во-первых, они делают вероятностные прогнозы в течение многих лет. Во-вто­
рых, задача постоянно повторяется; вопрос, на который нужно ответить (Бу­
дет ли дождь?) - всегда тот ж е самый. Напротив, лечащий врач постоянно рас­
сматривает множество возможностей (Действительно ли это перелом черепа?
У нее фарингит? Он нуждается в дальнейшей госпитализации?). Наконец, об­
ратная связь исхода для синоптиков хорошо определена и быстро получена.
Это не всегда так для врачей; пациенты могут не возвращаться или обратиться
в другое место, или диагнозы остаются неопределенными.
Люди, которые держат пари или устанавливают вероятность на скачках,
могли бы такж е считаться экспертами. При тотализаторном методе, оконча­
тельная вероятность определена количеством денег, поставленных на каж ­
дую лош адь, что позволяет вычислить своего рода кривую калибровки. Та­
кие кривы е (Fabricand, 1965; Hoerl и Fallin, 1974) показывают превосходную
калибровку людей, с небольшой тенденцией ставить на кон слиш ком много
на длинных дистанциях. Однако такие данные только теоретически связаны
с оценкой вероятности. Более уместные результаты калибровки, сообщенные
Дауи (Dowie, 1976), который изучал предполагаемые ставки, напечатанные
ежедневно в спортивной газете в Британии. Эти прогнозы, в форме вероятно­
стей, сделаны одним человеком для всех лошадей в данной скачке; прибли­
зительно восемь человек делали прогнозы в течение исследуемого года. К а­
либровка прогнозов для 29.307 лошадей показала небольшую неуверенность
для вероятностей большее чем 0.4 и превосходную калибровку для вероятно­
стей меньше чем 0.4 (что включило 98% данных).
Развиваю щ ееся исследование относительно калибровки привело к разви­
тию нового вида экспертизы: эксперты калибровки, которые знают об общих
ош ибках, которые люди делают в оценке вероятностей. Лихтенш тейн и Фиш-
хофф (1980а) сравнили калибровку 8 таких экспертов с 12 неопытными ис-
пы туемы мии 15 испытуемыми, которые предварительно были обучены, что­
бы быть хорошо калиброванными. Нормативные эксперты не только преодо­
лели самонадеянность, типично показанную неопытными испытуемыми, но
и очевидно чрезмерно ее компенсировали, поскольку они были неуверенны­
Калибровка вероятностей... 369
ми в себе. Эксперты были более чувствительны к трудности вопросов, чем
две другие группы.
Будущие события. Райт и Виш худха (W right & W ishudha, 1979) предпо­
ложили, что калибровка для будущих событий может отличаться от калиб­
ровки для вопросов на выявление уровня общих знаний. Если это верно, это
ограничило бы экстраполяцию от исследования с вопросами по общей осве­
домленности к прогнозированию будущих событий. К сожалению, вопросы
Райта и Виш удха на общие темы были более трудными, чем их будущие со­
бытия, что может объяснить лучшую калибровку последних.
Фишхофф и Бейт (Fischhoff и Beyth, 1975) попросил 150 израильских сту­
дентов оценить вероятность 15 будущих событий, возможные исходы широ­
ко освещенной в средствах массовой информации поездки Президента Н ик­
сона в К итай и Россию (например, “Президент Никсон встретится с Мао, по
крайней мере, один раз”). Результирую щ ая кривая калибровки была весьма
близка к линии идентификации. Однако, Фишхофф и Лихтенш тейн (не опуб­
ликовано) недавно обнаружили, что калибровка будущих событий показала
ту же высокую самонадеянность, как и для вопросов на общие темы сопоста­
вимой трудности. Ф иллипс и Чу (не опубликовано) получили кривые калиб­
ровки для трех наборов вопросов: общие темы, будущие и прошлые события
(например, “авиалайнер-гигант потерпел круш ение, и погибло более 100 че­
ловек за прошедший месяц”). Все три кривы е показали самонадеянность.
Калибровка для будущих и прошлых событий была идентична, и несколько
лучше, чем для вопросов на общие темы. Уровни трудностей трех наборов
вопросов не могли объяснить эти результаты.
Дж ек Доуи (Dowie) и его коллеги теперь собирают данные калибровки в
Заочном университете в Милтоне Кейнесе, А нглия, от нескольких сотен сту­
дентов на курсах по изучению риска, используя вопросы, связанные с кур­
сом, на общие темы и о событиях будущего. Студенты получили общее пред­
ставление о концепции калибровки, и им предложили обратную связь отно­
сительно их результатов и калибровки. Предварительные результаты (Dowie,
1980) говорят, что они были умеренно самонадеянны. Калибровка была луч­
шая в вопросах на общие темы и сам ая плохая в вопросах, связанны х кур­
сом, но значимость и происхождение этих различий еще нужно исследовать.

Н еп р ер ы в н ы е п р ед п о л о ж ен и я : н ео п р ед ел ен н ы е в е л и ч и н ы

Метод к ва н т и ля
Неопределенность значения неопределенной непрерывной величины (на­
пример, к ак ая доля студентов предпочитает скотч бурбону? Каково самое
короткое расстояние от А нглии до А встралии?) может быть вы раж ена к ак
ф ункция плотности вероятности для возможных значений этой величины.
Однако экспертов обычно не просят строить всю функцию . Вместо этого,
370 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
обы чная процедура - некоторая разновидность метода кван ти ля. В этом
методе оцениваю щ ий задает значения неопределенной величины , которые
связаны с м аленьким количеством предопределенных квантилей распреде­
ления. Д ля медианы или квантиля 0.50, например, оцениваю щ ий задает
такое значение величины , что истинное значение, с равной вероятностью
будет попадать выш е или ниж е заданного значения; квантиль 0 .0 1 - это та­
кое значение, что существует только 1 шанс из 100, что истинное значение
является меньш им, чем заданное. Обычно оцениваю тся три или пять кван­
тилей, вклю чая медиану. В варианте под названием метод тертилей, оце­
ниваю щ ий задает две величины (0.33 и 0.67 квантили) такие, что полный
диапазон разделен на три одинаково вероятных секции.
Обычно регистрирую тся два измерения калибровки. Межквартилъный
индекс - процент вопросов, для которых истинное значение попадает в меж-
квартильны й диапазон (то есть, между квантилям и 0.25 и 0.75). Полнос­
тью калиброванны й человек будет, в конечном счете, иметь меж квартиль-
ный индекс 0.50. Индекс неожиданности - это процент истинны х значе­
ний, которы е не попадают в крайние оцененные квантили. Когда наиболее
крайние квантили оценены к ак 0.01 и 0.99, полностью калиброванный че­
ловек будет обладать индексом неожиданности 2. Больш ой индекс неож и­
данности показы вает, что границы уверенности экспертов были слиш ком
узким и, чтобы охватить достаточно истинны х значений, и таким образом,
указы вает на самонадеянность (или гиперточность; P itz, 1974). Неуверен­
ность будет обозначена меж квартильны м индексом больше 50 и низким ин­
дексом неожиданности; ни о каки х подобных данны х не сообщалось в лите­
ратуре.
Импульс для исследования калибровки ф ункций плотности вероятнос­
ти появился в 1969 в книге А льперта и Рейфа (A lpert и R aiffa, 1969, 21).
А льперт и Рейфф а работали со студентами бизнес ф акультета Гарварда, к о­
торые были знакомы с анализом принятия реш ений. В группе 1, все испы ­
туемые оценивали пять квантилей, три из которы х были 0.25, 0.50 и 0.75.
Крайние квантили различались для четы рех подгрупп; 0.01 и 0.99 (группа
А); 0.001 и 0.999 (группа В); “м иним альная возмож ная величина” и “м ак­
сим альная возмож ная величина” (группа С); и “удивительно н и зкая вели­
чин а” и “удивительно вы сокая величина” (группа D). М еж квартильны е ин­
дексы и индексы неожиданности для этих четы рех подгрупп показаны в
табл. 1. Разочарованные большим количеством случаев неожиданности, А ль­
перт и Рейффа провели эксперимент с тремя дополнительными группами (2,
3 и 4) которые, после оценки 10 неопределенных величин, получили обрат­
ную связь в форме расширенного сообщения и объяснения результатов, н а­
ряду с призывом “Расш ирьте ваш и крайние квантили!” Затем испытуемые
ответили на 10 новых неопределенных величин. Результаты до и после полу­
чения обратной связи показаны в табл. 1. Результаты улучш ились, но испы­
туемые все ещ е показы вали значительную самонадеянность.
Калибровка вероятностей... 371
Хессиан и М акКарти (Hession и M cCarthy, 1974) собрали данные, сопоста­
вимые с первым экспериментом Альперта и Рейффы, используя 55 неопреде­
ленных величин и 36 аспирантов в качестве испытуемых. Их инструкции
вынудили испытуемых убедиться, что интервал между квантилем 0.25 и кван­
тилем 0.75 действительно захватывает половину вероятности. “Более позднее
обсуждение с отдельными испытуемыми прояснило, что эта проверка после­
довательности закончилась в большинстве случаев реорганизацией, умень­
ш ая первоначально оцененный межквартильны й диапазон” (с. 7) таким об­
разом, все только ухудшилось! Этот акцент на обучение, не используемый
Альпертом и Рейффом, может объяснять, почему испытуемые Хессиан и М ак­
Карти были так плохо калиброваны , к ак показано в Таблице 1.

Таблица 1. Резюме калибровки для непрерывных вопросов: Процент истин­


ных значений, попадающих в межквартильный диапазон и не попадающих
в экстремумные квантили

Н аблю И н д е к с н еож и дан н ост и


даем ы е
N м еж квар-
т ильны е наблю - и д е а л ьн ы й
и н дексы .• даем ы й
Алъпертп и Р е й ф ф а (1 9 6 9 )
Группа 1-А (0.01,0.99) 880 46 2
Группа 1- В (0.001, 0.999) 500 33 40 0.2
Группа 1-С ("мин” и "макс") 700 47 ?
Группа 1-D ("удивительно
700 38 ?
высокая/низкая величина")
Группы 2 ,3 и 4
До обучения 2.270 34 34 2
После обучения 2.270 44 19 2
Х е с с и а н и М акКарт и (1 9 7 4 ) 2.035 25 47 2
С ел в и ж д ( S e lv id g e , 1 9 7 5 )
Пять квантилей 400 56 10 2
Семь квантилей (вкл. 0.1 и 0.9) 520 50 7 2
М осковит пц и Б у л л е р с
( M o s k o w itz & B u lle rs, 1 9 7 8 )
Пропорции
Три квантиля 120 - 27 2
Пять квантилей 145 32 42 2
Доу-Джонс (Dow-Jones)
Три квантиля 210 - 38 2
372 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Продолжение табл. 1

П и к х а р т и В о л л е й с ( P ic k h a r d t
& W a lla c e , 1 9 7 4 )
Группа 1
Первое испытание ? 39 32 2
Пятое испытание ? 49 20 2
Группа 2
Первое испытание ? 30 46 2
Шестое испытание ? 45 24 2
Т. А . Б р а у н (Т .А . B r o w n ,1 9 7 3 ) 414 29 42 2
Л и х т е н ш т е й н и Ф иш хоф ф
(L ic h te n s te in & F isc h h o ff,
1980b)
До испытания 924 32 41 2
После испытания 924 37 40 2
С и вер, ф он В и н т е р ф е л ь д т и
Э д в а р д з (S e a v e r , v o n
W in te r f e ld t & E d w a r d s , 1 9 7 8 )
Квантили 160 42 34 2
Вероятностные квантили 160 53 24 2
Вероятности 180 57 5 2
Шансы 180 47 5 2
Протокол шансов 140 31 20 2
Ш еф ер и Б о р ч е р д и н г (S c h a e fe r и
B o rc h e rd in g , 1 9 7 3 )
Первый день, квантили 396 23 39 2
Четвертый день, квантили 396 38 12 2
Первый день, гипотетическая 50 2
396 16
выборка
Четвертый день, 6 2
396 48
гипотетическая выборка
Л а р со н и Р и н а н (L arson &
R eenan, 1 9 7 9 )
"Вполне уверен" 450 42 ?
П р е т т (P r a tt, 1 9 7 5 )
"Удивительно высокие/ 175 37 5 ?
низкие" значения
Калибровка вероятностей... 373

Продолжение табл. 1

М ер ф и и В и н к л е р (M u r p h y и
W in k le r , 1 9 7 4 )
Экстремумы 0.125 и 0.875 132 45 27 25
М ер ф и и В и н к л е р (M u r p h y и
W in k ie r , 1 9 7 7 b )
Экстремумы 0.125 и 0.875 432 54 21 25
Штаел фон Хольстен (Stael von
1,269 27 30 2
Holstern, 1971а)

Примечание: N - общее количество оцененных распределений.


аИ деальный процент событий, попадаю щ их в пределы меж квартильного
диапазона 50, для всех экспериментов кроме Брауна (1973). Он вы являл
квантили 0.30 и 0.70, так что идеал - 40 % .

Хессиан и М акКарти такж е предлож или испытуемым множество инди­


видуальны х черт характера: авторитаризм, догматизм, ж есткость, ш кала
ш ирины категории Петтигрю и интеллект. К орреляции экзаменационны х
отм еток испы туем ы х с их м еж кварти льн ы м и индексам и и индексам и
неожиданности были весьма низким и, хотя ш кала авторитаризма соотно­
силась к ак -0 .3 1 с м еж квартильной оценкой и + 0.47 с оценкой неож идан­
ности (N = 28). Это соответствует выводу Райта и Ф иллипса (1976), что авто­
ритаризм был мало связан с калибровкой.
Селвидж (Selvidge, 1975) расш ирил исследование Альперта и Рейффы, сна­
чала задав испытуемым четыре вопроса относительно их самих (например,
“Вы предпочитаете скотч или бурбон?”). И х ответы определили истинный
ответ для долей, произведенных группой (например, к акая доля испытуемых,
ответивш их на анкетный опрос, предпочитала скотч бурбону?). Одна группа
дала пять квантилей, 0 .0 1 ,0 .2 5 ,0 .5 0 ,0.75 и 0 .9 9 . Другая группа дала эти ж е
пять плюс два других: 0.1 и 0.9. К ак показано в Таблице 1, группа с семью
квантилями показала немного лучш ие результаты. Результаты с пятью кван­
тилями не столь отличны от результатов А льперта и Рейффы, как каж ется.
Три неопределенные величины А льперта и Рейффы были долями, произве­
денными группой, подобно вопросам Селвиджа. В этих трех вопросах, Аль-
пертиРейф ф а обнаружили 57% в межквартильном диапазоне и 20% неожи­
данностей. Наконец, для одного из вопросов, половину испытуемых в ipynne
с пятью квантилями просили сначала дать 0.25, 0.50 и 0.75, а затем 0.01 и
0.99, в то время к ак другую половину попросили сначала оценить экстрему­
мы. Селвидж обнаружил меньше случаев неожиданности для прежнего по­
рядка (8% ), чем для последнего (16% ).
М осковитци Буллерс (Moskowitz и B ullers, 1978) такж е использовали про­
порции, произведенные группой, но обнаружили намного больше случаев
374 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
неожиданности, чем Селвидж. Одна группа дала те ж е самые пять кванти­
лей, которые использовал Селвидж (в порядке 0 .5 ,0 .2 5 ,0 .7 5 ,0 .0 1 ,0 .9 9 ). Дру­
гую группу попросили сделать только три оценки (способ распределения и
квантили 0.01 и 0.99). Перед оцениванием, группе с тремя квантилями пред­
ставили некоторые типичные базовые события (например, “Рассмотрим ло­
терею, в которой участвуют 100 человек. Ваш шанс получить выигрыш ный
билет равняется 1 из 100”), чтобы обеспечить лучшее понимание вероятнос­
ти 0.01. К ак показано в Таблице 1, у группы с тремя квантилями было мень­
шее количество случаев неожиданности, чем у группы с пятью квантилями.
В другом эксперименте, использующем те ж е самые два метода, М осковиц и
Буллерс попросили 44 старш екурсника, специализирую щ ихся в коммерции,
оценить среднее значение индустриального индекса Доу-Джонса (Dow-Jones)
за 1977,1974,1965, I960 и 1950 годы. Каждый испытуемый дал оценки дои
после участия в обсуждениях с тремя людьми. Так как никаких системати­
ческих различий из-за участия в обсуждении не было обнаружено, данные
были объединены в Таблице 1. Опять ж е, группа с тремя квантилями (в кото­
рой испытуемые получили представление о значении 0.01) имела меньшее
количество случаев неожиданности, чем группа с пятью квантилями. Резуль­
таты группы с пятью квантилями были чрезвычайно плохими.
П икхарт и Воллейс (P ickhardt и W allace, 1974) повторил работу Альпер-
та и Рейффы с изменениями. Д ля нескольких групп они сообщили об обна­
руж ении от 38% до 48% случаев неожиданностей до получения обратной
связи и не меньше, чем 30% неожиданностей после получения обратной свя­
зи. Две разновидности, используя или не используя зачет по предмету как
награду за хорошую калибровку и используя или не используя расчетные
правила обратной связи, не привели к каким-либо различиям в количестве
случаев неожиданностей. П икхарт и Воллейс такж е изучали влияние рас­
ш иренного обучения: две группы из 18 и 30 испы туем ы х (о количестве
неопределенных величин не сообщается) прош ли пять и ш есть серий испы ­
таний с калибровочной обратной связью после каж дого испы тания. Было
обнаружено небольшое лучш ение, к ак показано в табл. 1.
Н аконец, П икхарт и Воллейс (1974) изучали влияние увеличиваю щ его­
ся знания н а калибровку в контексте игры моделирования производства
PROSIM. Тридцать два аспиранта произвели 51 оценку в течение смодели­
рованны х 17 “дней” планирования производства. К аж дая оценка касалась
события, которое произойдет через 1, 2 или 3 “дн я”. Чем ближ е время оце­
нивания ко времени события, тем больше испытуемый знал о событии. Са­
монадеянность уменьш илась с увеличением информации: оказалось 32%
неожиданностей с 3-дневными задерж кам и, 24% с 2-дневными задерж ка­
ми, и 7% с 1-дневными задерж ками. У лучш ения не наблюдалось в течение
17 “дней” стимуляции.
Т.А . Браун (1973) попросил 31 испытуемого оценить семь квантилей
(0.01, 0.10, 0.30, 0.50, 0.70, 0.90, 0.99) для 14 неопределенных величин.
Результаты , показанны е в табл.1, являю тся особенно обескураживаю щ и­
Калибровка вероятностей... 375
м и, потому что каж ды й вопрос сопровождался обширными историческими
данными (например, для вопроса “Н а какой отметке будет находиться ин­
декс потребительских цен в декабре 1970?” испытуемым предлагали индек­
сы потребительских цен в течение каж дого квартала между мартом 1962 и
июнем 1970). Д ля 11 вопросов, независимо от того, дал ли испытуемый ис­
торический минимум к ак квантиль 0.01 и исторический максимум к ак
квантиль 0.99, у них не было неожиданностей вообще. Другие 3 вопроса
показали строгое увеличение или строгое уменьш ение историй, и истинная
величина бы ла близка к простому приближению исторической тенденции.
Испытуемые, должно быть, сильно полагались н а свои собственные ош и­
бочные знания, чтобы дать распределения, настолько плотные, чтобы пока­
зать 42% случаев неожиданности.
Л ихтенш тейн и Фишхофф (1980b) вы явили пять квантилей (0.01, 0.25,
0 . 5 .0 .7 5 .0 .9 9 ) от 12 испытуемых на 77 неопределенных величинах, к ак до,
так и после того, к ак испытуемые получили обширное обучение калибров­
ке на дискретны х двух-альтернативны х вопросах. К ак показано в Таблице
1, испытуемые не улучш или значимо калибровку по неопределенным ве­
личинам.

Д ругие методы
Сивер, фон Винтерфельдти Эдвардз (Server, von W in terfeld tи Edw ards, 1978)
изучали влияние пяти различны х способов ответа на калибровку. Две груп­
пы использовали метод одного квантиля, либо пяти квантилей (0 .0 1 ,0 .2 5 ,
0.50, 0.75, 0.99), либо эквиваленты вероятности этих квантилей (1 :9 9 ,1 :3 ,
1:1, 3:1, 99:1). Три других группы отвечали вероятностями, ш ансами или
заполняли протоколы шансов н а одно-альтернативные вопросы, которые
определяли некоторое значение неопределенной величины (например, “К а­
кова вероятность того, что население Канады в 1973 превысило 25 милли­
онов?”). П ять таких установленных значений давались для каж дой неопре­
деленной величины , и, исходя из ответов, экспериментаторы оценивали
м еж квартильны е индексы и индексы неожиданности. Д ля каж дого мето­
да, семь из девяти студентов отвечали н а 20 неопределенных величин. Как
показано в Таблице 1, группы, дающие вероятностные ответы и ответы ш ан­
сов, показали лучш ие индексы неожиданности, чем испытуемые, исполь­
зующ ие метод квантиля. Н еясно, появляется ли это превосходство из-за ин­
ф орм ации, сообщенной значениям и, которы е вы брал экспериментатор.
Способ ответа на протоколы ш ансов не функционировал должным образом.
Ш ефер и Борчердинг (Schaefer и B orcherding, 1973) попросили 22 сту­
дентов оценить 18 пропорций, сделанных группой, в каж дом из четырех ис­
пы таний. К аж ды й испытуемый использовал два метода оценки: (а) метод
квантиля (0.01, 0 .1 2 5 ,0 .2 5 ,0 .5 ,0 .7 5 ,0 .8 7 5 ,0 .9 9 ), и (Ь) метод гипотетичес­
ки х выборок. В последнем методе, оцениваю щ ий задает размер, п, и число
успехов, г, гипотетической выборки, которая лучш е всего отраж ает знание
376 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
экспертов неопределенной величины (то есть, я чувствую себя столь ж е уве­
ренны м относительно истинного значения пропорции, к ак я чувствовал бы
себя, если бы я наблюдал выборку из п событий с г успехами). Больш ие зна­
чения п отраж аю т большую уверенность относительно истинного значения
пропорции. Отношение r/п отраж ает среднее значение функции плотности
вероятности. Испытуемые испы ты вали большие трудности в этом методе,
несмотря на инструкции, которые вклю чили примеры бета распределений,
леж ащ их в основе этого метода. После каждого испытания, испытуемым пред­
лагали обширную обратную связь, с акцентом на их собственной калибровке
и калибровке группы. Результаты первого и последнего испы тания показа­
ны в табл. 1. Улучш ение было обнаружено для обоих методов. Результаты ме­
тода гипотетических выборок, в начале давал результаты хуж е (50% неожи­
данностей и только 16% в межквартильном диапазоне), а в конце лучш е (6%
неожиданностей и 48% в межквартильном диапазоне), чем метод квантиля.
Б арклей и Петерсон (B arclay и P eterson, 1973) сравнили метод тертилей
(то есть, квантили 0.33 и 0.67) с “точечным” методом, в котором оцениваю­
щ его просят дать модальное значение неопределенной величины , а затем
два значения, одно выш е и одно ниж е моды, каж дое из которых может про­
изойти такж е вероятно, к ак и модальное значение (то есть, точки, для кото­
ры х ф ункция плотности вероятности является наполовину настолько ж е
вы сока, как и в моде). П ри использовании 10 вопросов к ак неопределенных
величин и 70 студентов Ф акультета внеш ней разведки в межгрупповом про­
екте, для метода тертилей они обнаруж или, что 29% (а не 33% ) истинных
ответов попадают в центральны й интервал. Д ля точечного метода, только
39% попадаю т между двумя равновероятными точками, принимая во вни­
мание, что, для больш инства распределений, приблизительно 75% плотно­
сти попадает между этими точками.
П итц (P itz , 1974) сообщил о нескольких результатах, использую щ их ме­
тод тертилей. Д ля 19 испытуемых, экспертов населения 23 стран, он обна­
руж ил только 16% истинны х значений, попадающ их в центральную треть
распределений. В другом эксперименте он изменил вопросы согласно глу­
бине и богатству знаний, которыми, по его предположению, обладали ис­
пытуемые. Д ля населения стран (низкое знание) он обнаружил 23% истин­
ны х значений в центральной трети; для высот известных зданий (посред­
ственное знание) 27% ; а для возрастов известных людей (высокое знание)
47% , причем последнее означение было намного больше ож идаемы х 33% .
В другом исследовании, он попросил 6 испытуемых оценить тертили и не­
скольким и днями позж е, сделать выбор среди ставок, основанных на их соб­
ственны х значениях тертилей. Он обнаружил сильное предпочтение став­
кам , из центральной области, к ак раз противоположное к чему должно было
привести плотное расположение интервалов.
Испытуемые Ларсона и Ринана (Larson и Reenan, 1979) сначала угадывали
истинный ответ (то есть, моду) и затем еще два значения, которые определяли
интервал, в пределах которого, они были “вполне уверены”, находился пра­
Калибровка вероятностей... 377
вильный ответ. Сорок два процента истинных значений, леж али вне этой обла­
сти. Обратите внимание, насколько похож этот индекс неожиданности на ин­
дексы испытуемых Альперта и Рейффы, которым дали вербальные формули­
ровки “минимум / максимум” (47% ) и “удивительно высоко / низко” (38%).

Реальные задачи с эксперт ами


Претт (1975) попросил некоторого эксперта дать прогноз посещаемости для
175 кинофильмов или двойных сеансов, показанны х в двух местных кино­
театрах в течение более, чем одного года. Эксперт оценил медиану, кварти­
ли “удивительно высокие” и “удивительно низкие” значения. К ак показа­
но в табл. 1, меж квартильны й диапазон имел тенденцию быть слиш ком ма­
леньким. Д аж е притом, что эксперт получал обратную связь исхода в тече­
ние эксперимента, единственное свидетельство улучш ения калибровки че­
рез какое-то время приш ло в первые несколько дней.
Три эксперимента использовали синоптиков в качестве испытуемых. В
двух экспериментах Мерфи и Винклер (M urphy и W inkler, 1 9 7 4 ,1977b) про­
сил синоптиков давать пять квантилей (0.125, 0.25, 0 .5 ,0 .7 5 ,0 .8 7 5 ) для вы ­
сокой температуры завтра. Результаты, показанные в табл. 1, указываю т пре­
восходную калибровку. Эти испытуемые имели меньшее количество случаев
неожиданности в экстремуме распределения 25 % чем, большинство испыту­
емых А льперта и Рейффы на экстремуме 2%! Мерфи и Винклер обнаружи­
ли, что пять испытуемых в двух экспериментах, которые использовали ме­
тод квантиля, были лучше калиброваны, чем четыре других испытуемых,
которые использовали метод фиксированного диапазона (fixed-w idth metod).
Для метода фиксированного диапазона, синоптики сначала оценили темпе­
ратуру медианы (то есть, высокой температуры, для которой, к ак они пола­
гали, существует вероятность 0.5, того, что она будет превышена). Затем они
задали вероятность, что температура будет падать с интервалами 5Т и 9°F со­
средоточенными в медиане. Эти синоптики были самонадеянные; вероят­
ность, связанная с температурой, попадающей в интервал, имела тенденцию
быть слиш ком большой. Превосходство метода квантиля над методом ф ик­
сированного диапазона в отличие от вывода Сивера, фон Винтерфельдта, и
Эдвардза, о предпочтительности методов фиксированных значений, возмож­
но, обусловлено тем, что установленные интервалы, используемые Мерфи и
Винклером (5 F и 9°F) были неинформативны.
Ш таел фон Хольстен (Stael von H olstein, 1971а) использовал три задачи
фиксированных оценок: (а) средняя температура на завтра и на следующий
день (с разделением полного диапазона ответа на восемь категорий), (Ь) сред­
н яя температура через 4 и 5 дней (восемь категорий), и (с) общ ая количество
осадков в следующ ие 5 дней (четыре категории). От каж дого набора ответов
(четыре или восемь вероятностей, в сумме дающие 1.0) он оценил основную
совокупную функцию плотности. Затем он объединил 1.269 ф ункций, дан­
ные 28 участниками. Исходя из групповой совокупной ф ункции плотное-
378 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ти, показанной в его статье, мы оценили индексы неожиданности и меж-
квартильны е индексы (см. табл. 1). В отличие от других синоптиков, эти ис­
пытуемые были весьма плохо калиброваны , возможно, потому что задачи
были менее знакомы .

Резюме о калибровке с неопределенными величинам и


П одавляю щ ее большинство свидетельств из исследования, использующ его
квантили для оценки неопределенных величин, говорит о том, что распре­
деления вероятности имеют тенденцию быть слиш ком плотными. Оценка
крайних квантилей особенно склонна смещ аться. Обучение несколько улуч­
ш ает калибровку. Результаты экспертов иногда высоки (M urphy и W inkler,
1974, 1977b), иногда нет (P ra tt, 1975; Stael von H olstein, 1971a). Имеется
некоторое свидетельство, что трудность связана с калибровкой для непре­
ры вны х предполжений. П итц, Ларсон и Ринан (P itz, 1974 и Larson и Reenan,
1979) обнаруж или это влияние, П икхарт и Воллейс (P ickhardt и W allace,
1974) обнаруж или, что 1-дневные задерж ки приводили к меньш ему коли­
честву неожиданностей, чем 3-дневные задерж ки в их игре моделирования.
Н есколько исследований (например, B arclay и P eterson, 1973; M urphy и
W inkler, 1974) сообщили о корреляции между распространением оценен­
ного распределения и абсолютной разностью между оцененной медианой и
истинным ответом, указы вая, что испытуемые частично чувствительны к
тому, насколько, сколько они знаю т или не знаю т. Эта находка проводит
параллель с корреляцией между процентом правильны х ответов и средним
ответом с дискретны ми предлож ениями.

О б суж д ен и е

Зачем нуж на хорошая калибровка?


Почему оцениваю щ ий вероятность должен волноваться относительно того,
хорошо ли он калибровали? Фон Винтерфельдт и Эдвардз (1973) показали,
что в больш инстве ж изненны х проблем принятия реш ения с непрерывны­
ми выборами реш ения (например, влож ите X долларов) довольно серьез­
ные ош ибки оценки имеют относительно небольшое значение для ож идае­
мого результата. Однако некоторые соображения приводят доводы против
этой точки зрения. Во-первых, в двух-альтернативной ситуации, ф ункция
вознаграж дения может быть весьма крута в критической области. Предпо­
лож им , что ваш доктор должен оценить вероятность, что Вы имеете состоя­
ние А , и долж ны получить лечение А, против того, что у Вас состояние В и
лечение В. П редположим, что ситуация такова, что лечение А является луч­
ш е, если вероятность, что Вы имеете состояние А больш ая или равна 0.4;
иначе, лучш е лечение В. Если доктор оценивает вероятность, что Вы имеете
А к а к р (А) = 0.45, но плохо калиброван, так, что соответствующ ая вероят­
Калибровка вероятностей... 379
ность 0.25, тогда доктор использовал бы скорее лечение А, чем лечение В, и
Вы будете терять много ожидаемой полезности. Реш ение функции полезно­
сти реальной ж изни именно этого типа показаны Фрайбеком (Fryback, 1974).
Кроме того, когда вознаграж дения очень большие, когда ош ибки очень
большие, или когда эти ош ибки сложные, ожидаемые потери каж утся боль­
ш ими. Н апример, в исследовании радиоактивной безопасности (А мерикан­
ская Комиссия по Атомному Регулированию , 1975) “накаж дом уровне ана­
лиза нормальное логарифмическое распределение данных пропорции неуда­
чи было принято с определенными процента:льными пределами 5 и 95 ”
(W eatherw ax, 1975, с. 31). Исследование, приведенное здесь, показы вает,
что распределения, построенные из оценок квантилей 0.05 и 0.95 могут быть
чрезвычайно смещ ены. Если такие оценки сделаны на нескольких уровнях
анализа, с каж ды м оцененным распределением, являю щ имся слиш ком уз­
ким, ош ибки не будут отменять друг друга, а будут дополнять. И потому что
цена сбоя на атомной электростанции велика, ож идаемая потеря от таких
ошибок м огла быть огромна.
Если хорош ая калибровка важ на, к ак ее достичь? Кокс (Сох, 1958) счи­
тал, что мож но внеш не рекалибровать оценки лю дей, подгоняя модель к
набору оценок для вопросов с известны ми ответами. Тогда модель исполь­
зуется, чтобы исправлять или регулировать ответы , данны е экспертом.
Технические трудности, возникаю щ ие перед внеш ней перекалибровкой
сущ ественны . П ри вы явлении оценок, которы е будут смоделированы ,
нуж но быть осторож ными, чтобы не дать оцениваю щ ему больш е обрат­
ной связи , чем они обычно получаю т, из страха того, что они изм енят свою
калибровку, когда она изм еряется. К ак указал Сэвадж (Savage, 1971), “Вы
могли бы обнаруж ить на опы те, что ваш эксперт в некотором отнош ении
оптимистичен или пессимистичен, и поэтому см ягчать его суж дения. Если
он заподозрит Вас в этом, однако, и Вы, и он вполне мож ете приблизиться
к гибели” (с. 796). Т ак к ак исследование показало, что тип наблюдаемого
расбаланса калибровки зависит от уровня трудности задачи, возмож но,
приш лось бы такж е полагать, что будущее будет соответствовать трудно­
сти событий, используемы х для перекалибровки.
Теоретические возраж ения внеш ней перекалибровке могут быть даж е
более серьезны , чем практические. Ч исла, произведенные процессом пе­
рекалибровки не будут следовать аксиомам теории вероятности (напри­
мер, числа, связанны е со взаимно исклю чаю щ ими и исчерпываю щ ими со­
бы тиями будут не всегда в сумме давать единицу, и при этом вообще не
будет истинно что Р(А)*Р (В) = Р (А, В) для независимы х событий); следо­
вательно, эта новые числа не могут назы ваться вероятностями.
Более плодотворный подход состоял бы в том, чтобы обучить экспертов
самокалибровке. При каки х условиях можно ожидать, что эксперты достиг­
нут этой цели? Н ельзя ожидать, что эксперты будут хорошо калиброваны,
если явн ая или неявная награда для оценок не мотивирует их быть честными
в их оценках. К ак крайний пример можно рассмотреть оценивающего, нахо­
380 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
дящ егося под угрозой казни, если произойдет событие, вероятность которого
была оценена в < 0.25, который будет иметь серьезное основание не быть хо­
рошо калиброванным с оценками 0.20. Хотя этот пример каж ется абсурдным,
более тонкие давления такие как “не выглядеть глупо” или “произвести впе­
чатление на босса” могли бы такж е обеспечивать сильные стимулы для пло­
хой калибровки. Любое вознаграждение либо за размы ш ления, либо за опро­
вержение могло бы такж е смещать оценки.
П ри получении обратной связи исхода после каж дой оценки - лучш ее
условие для успешного обучения. Дейвид (Dawid) показал, что при таких
условиях эксперты , которы е являю тся честны ми и последовательны ми
субъективистами, будут хорошо калиброваны независимо от взаимозави­
симости среди оцениваемых вопросов. Н апротив, Кадан (K adane, 1980) по­
казал , что в отсутствии обратной связи исхода “испы тание за испытанием”,
честны й, последовательный субъективист будет, к ак ож идается, хорошо
калиброван, только тогда, когда все оцениваемые вопросы независимы . Эта
теорема наклады вает сильные ограничения на ситуации, при которых было
бы разумно ож идать, что эксперты будут учиться быть хорошо калиброван­
ны ми. Д аж е если процесс обучения мог проводиться с использованием толь­
ко событий, которые, к ак считали эксперты , независимы, мож ет иметься
серьезное основание, чтобы сомневаться относительно независимости задач
реальной ж изни, к которым эксперты применили бы их обучение. Важные
будущие события могут быть взаимозависимыми либо потому что они нахо­
дятся под влиянием общей основной причины , либо потому что оцениваю ­
щ ий рассматривает их к ак идущ ие из основного запаса знаний. В таких об­
стоятельствах, можно не хотеть или не ож идать хорош ей калибровки.
Возможность, что предубеждения людей изменяю тся к ак ф ункция труд­
ности задачи, препятствует обучению калибровке при отсутствии немедлен­
ной обратной связи исхода. Уровень трудности будущих задач мож ет быть
невозможно предсказы вать, таким образом, делая обучение неэффектив­
ны м.

Калибровка ка к когнит ивная психология


Эксперименты по калибровке могут использоваться, чтобы понять, как люди
думают. Д аж е если непосредственное практическое значение каж дого ис­
следования ограничено, оно может все-таки обеспечить понимание того, к ак
люди развиваю т и вы раж аю т чувства определенности и неопределенности.
Однако, поразительны й аспект литературы , рассмотренный здесь - ее “су­
хой эм пиризм”. П сихологическая теория часто отсутствует, либо к ак по­
буж дение для исследования, либо к ак объяснение результатов.
Не все авторы избеж али теоретизирования. Словик (Slovic, 1972а)иТвер-
ски и К анеман (Tversky и K ahnem an, 1974, 1) считали, что, в результате
ограниченны х способностей обработки информации, люди принимаю т уп­
рощ енные правила или эвристики. Х отя в целом полезные, эти эвристики
Калибровка вероятностей... 381
могут приводить к серьезным и систематическим ош ибкам. Например, тен­
денция людей, давать плотные распределения при оценке неопределенных
величин могла отраж ать эвристику, называемую “привязка и регулирова­
н и е.” Когда людей спраш иваю т относительно неопределенной величины,
они естественно думают сначала о точечной оценке, такой к ак медиана. Это
значение тогда служ ит к ак привязка. Чтобы давать 25-ый или 75-ый про­
цен тиль, человек регулируется вниз или вверх от значения привязки. Но
закрепитель имеет такое доминирующее влияние, что регулирование я в л я­
ется недостаточным; следовательно, квантили находятся слиш ком близко
вместе, вы давая самонадеянность.
П итц (P itz, 1974) такж е допустил, что способность людей в обработке ин­
формации и вместимость рабочей пам яти ограничены. Он предполагал, что
люди занимаю тся сложными проблемами последовательно, прорабатывая
часть за частью . Чтобы уменьш ить когнитивное напряж ение, люди игно­
рирую т неопределенность в своих реш ениях ранних частей проблемы, что­
бы уменьш ить сложность вычислений в более поздних частях. Это может
привести такж е к слиш ком плотным распределениям и самонадеянности.
П иц такж е предполагал, что один путь, которым люди оцениваю т свою соб­
ственную неуверенность, - это увидеть, сколько существует различны х пу­
тей, которыми они могут достигнуть ответа, то есть сколько различны х пос­
ледовательных реш ений они могут построить. Если найдено много путей,
люди признаю т собственную неопределенность; если найдено мало, они не
признаю т. Чем богаче база знаний, из которы х можно строить альтернатив­
ные структуры , тем меньше тенденции к самонадеянности.
Ф иллипс и Райт (1977) представили последовательную модель с тремя
стадиям и. И х модель разделяет людей, которые естественно склонны ду­
мать о неопределенности вероятностным способом, от тех, которые выбира­
ют из двух альтернатив. Их работа о культурны х и индивидуальны х разли­
чиях (W right и P hillips, 1976, W rig h t и другие, 1978) была попы ткой, с ча­
стичным успехом, идентифицировать различны е когнитивные стили в об­
работке этого типа информации.
Кориат и другие (K oriat, 1980) такж е принимали подход обработки ин­
формации. Они обсуждали три стадии оценки вероятностей. Сначала чело­
век ищ ет в пам яти соответствующее свидетельство. Затем он оценивает это
свидетельство, чтобы придти к чувству определенности или сомнения. Н а­
конец, он переводит чувство определенности в число. М анипуляции, исполь­
зуемые Кориатом и другими, были предназначены, чтобы изменить первые
две стадии, вы нуж дая людей искать и обращ ать внимание на противореча­
щее свидетельство, пониж ая свою уверенность.
Модель Ф еррелла и М акГои (F errell & McGoey, 1980), с другой стороны,
имеет дело полностью с третьей стадией, переводом чувства определеннос­
ти в числовые ответы. Допуская то, что без обратной связи люди не могут
изменить свои стратегии перевода по мере того, к ак либо трудность вопро­
са, либо основное значение событий изм еняется, модель обеспечивает силь­
ные прогнозы, которые получили подтверждение от данны х калибровки.
Н ачинаю т появляться теории структуры и процесса оценки вероятнос­
ти; и мы надеемся, что дальнейш ее развитие таких теорий будет служ ить,
чтобы объединить это довольно специализированное поле деятельности в
более ш ирокую область когнитивной психологии.
23. Обреченным необходимо изучать прошлое:
эвристики и предубеждения в ретроспективе*

Барух Фишхофф

Бенсон (Benson, 1972) идентифицировал четыре причины для изучения про­


шлого: развлекать, создавать групповую (или национальную) идентичность,
показать степень человеческих возможностей и развивать систематическое
знание относительно наш его мира, знание, которое мож ет, в конечном сче­
те, улучш ить наш у способность прогнозировать и управлять. Н а сознатель­
ном уровне, по крайней мере, мы, ученые-бихевиористы, ограничиваемся
последним мотивом. П реследуя его, мы исследуем случаи, оцениваем про­
граммы и делаем литературны е обзоры. Мы даж е проводим эксперименты,
создавая искусственны е истории, на которы х мы можем проверить свои
предполож ения.
Три основных вопроса, по-видимому, возникаю т в наш их размы ш лени­
ях о прош лом: (а) существуют ли модели, на которые мы можем опираться,
чтобы в будущем стать мудрее? (в) существуют ли случаи непредусмотри­
тельности, в которых мы можем увидеть ош ибки, которых следует избегать;
(с) мы действительно обречены повторять прошлое, если мы не изучаем его;
то есть действительно ли мы приобретаем опыт, огляды ваясь назад.
Н еважно, какой вопрос мы задаем, предполагается, что прошлое с готов­
ностью подскаж ет ответы. С точки зрения ретроспективы и дальновиднос­
ти, последнее оказы вается неприятной перспективой. М ожно объяснить и
понять любое событие прошлого, если применить соответствующее усилие.
Прогнозирование считается более сложным. Данное эссе исследует это пред­
положение, рассм атривая некоторы е первоначальны е попы тки вы явить
прошлое. Возможно, наиболее общее заклю чение - то, что мы долж ны уде­
лять больш е вним ания прош лому, если мы пы таемся вы явить его тайны . И

*Это - пересмотренная версия книги '‘Обреченным необходимо изучать прошлое: размыш­


ления об исторических оценках,” в книге под редакцией R. A. Shweder и D. W . Fiske. Новые
направления в методологии науки поведения: ошибочные суждения в исследовании пове­
дения. Сан-Франциско: Jossey-Bass, 1980. Переиздано в соответствии с разрешением.
384 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
хотя прош лое развлекает, облагораживает и легко расш иряется, оно про­
свещ ает только с помощью тонких уговоров.

В п о и с к а х м уд рости
Х отя прошлое никогда точно не повторяется, в нем часто можно обнаружить
повторяю щ иеся элементы. Люди принимаю т одинаковые реш ения, реш а­
ют одинаковые задачи и терпят одинаковые неудачи достаточно часто, что­
бы ученые-бихевиористы могли полагать, что они могут обнаружить повто­
ряю щ иеся образцы поведения. Такое убеждение заставляет психометрис-
тов изучать диагностические тайны клинических психологов-асов, клини-
цистов-и скать корелляты ненормального поведения, брокеров — замечать
признаки роста цен, а диктаторов — обдумывать революционные ситуации.
И х поиск обычно имеет логику, параллельную логике многократного рег­
ресса или корреляции. Собран набор соответствующих случаев, и каж ды й
член характеризован с помощью разнообразных измерений. В получивш ей­
ся матрице ищ ут существенные связи, которые могли бы помогать нам в
прогнозировании будущ его....

Формальное моделирование
Ежедневный бланк бегов (Daily Racing), например, предлагает серьезному
игроку приблизительно 100 отрезков информации относительно каж дой
лош ади в любом забеге. И грок, склонны й к обработке данны х, мог бы ввес­
ти в пам ять компью тера содержание одного издания и пробовать получить
формулу, предсказываю щ ую скорость к ак оцененную сумму множ ества в
различны х измерениях. Например:

у = Ъ]ХХ+ Ь2х 2 + 63jc3 (1)

где у — наш а оценка скорости лош ади, x t, является процентом ее побед в


преды дущ их гонках, х2- процент побед в гонках ее ж окея, и х 3- вес, кото­
ры й ей предстоит нести в данной гонке. Предположив, что использую тся
стандартизированны е записи результатов1, оценки (Ь), отражаю т важность
различны х факторов. Если 61=2Ь2, то данное изменение в проценте побед
лош ади воздействует на наш е прогнозирование скорости вдвое больше, чем
эквивалентное изменение в проценте побед ж окея, потому что прош лые дей­
ствия оказались вдвое более чувствительными к х 1, чем к х2.

1Чтобы стандартизировать значения определенной переменной, нужно вычесть среднее из


каждого значения и затем разделить на стандартное отклонение. Результат - это набор оч­
ков со средним, равным 0 и стандартным отклонением, равным 1.
Обреченным необходимо изучать прошлое... 385
Звучит просто, но здесь кроится ты сяча ловуш ек. Одна из них появляет­
ся, когда прогнозирую щие (х.), являю тся коррелированными, что может
происходить (и ф актически происходит), когда из вы игры ш а лошадей сле­
дует выигрыш ж окея (или наоборот). В таких случаях мультиколлинеар­
ности, к аж д ая перем енная имеет некоторую независимую способность
объяснять прошлое, а у двух есть некоторая общ ая особенность. Когда оцен­
ки определены, эта общ ая объяснительная способность, будет так или ина­
че разделена между этими двумя переменными. К ак правило, это разделе­
ние порождает (Ь;), не поддающееся толкованию с любой степенью точнос­
ти. Таким образом, уравнение регрессии нельзя рассматривать к ак теорию
скачек, показы вая важ ность различны х факторов.
Более скромная теоретическая цель состояла бы в том, чтобы определить,
какие ф акторы важ ны , а каки е - нет, на основе того, насколько каж ды й из
них помогает нам понять у. Здесь прим еняется логика пошаговой регрес­
сии, в уравнение добавляю тся дополнительные переменные, пока они что-
либо добавляют к его прогнозирующей (или объясняющей) способности. Все
ж е даж е эта миним алистская стратегия может привести к путанице муль­
тиколлинеарности. Если отраж ения некоторого фактора (например, различ­
ные аспекты воспитания) вклю чены , то их общая объяснительная способ­
ность может быть разделена на такие маленькие части, что ни один аспект
не внесет “значимого” вклада.
Конечно, эти нюансы могут мало интересовать игроков на скачках, пока
формула работает достаточно хорошо, чтобы приносить им вы игрыш . Мы
ж е, ученые, хотим не только эффективных методик, но и мудрости. Нам
тяж ело не интерпретировать оценки. Регрессивные процедуры не только
вы раж аю т, но и порождают понимание (или, по крайней мере, результаты)
механистическим, повторяю щ имся образом. Не удивительно, что им упор­
но следовали, несмотря на их ограничения. Один из лучш их документаль­
но подтвержденных примеров был обнаружен в исследовании оценивания
в клинике. Оценивающим был рентгенолог, который сортирует рентгено­
вские снимки опухолей на “доброкачественные” и “злокачественные”, кад­
ровый работник, который отбирает подходящ их кандидатов из списка, или
сотрудник кризисной служ бы , который реш ает, звонки каки х людей, гро­
зящ их покончить с собой, серьезны. В каж дом из этих примеров диагноз
вклю чает принятие реш ения на основе некоторых признаков. Когда, к ак в
этих примерах, принятие реш ений повторяется, и все случаи могут быть
охарактеризованы тем ж е набором признаков, можно статистически смо­
делировать стратегию принятия реш ений оценивающего. Человек собира­
ет набор случаев, для которы х эксперт делает суммарную оценку (напри­
мер, доброкачественное, серьезное), а затем выводит уравнение регрессии,
такое к ак Уравнение 1, оценки которого показывают важность, которую оце­
ниваю щ ий придал каж дом у признаку.
В течение двух десятилетий изучение такой стратегии постоянно приво­
дило к двум беспокоящ им выводам: (а) простые линейные модели, исполь­
386 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
зую щ ие оцененную сумму признаков, отлично прогнозируют реш ения ис­
пы туемы х, хотя (Ь) оцениваю щ ие заявили, что они использовали гораздо
более слож ны е стратегии (Goldberg, 1969,1970; Slovic & L ichtenstein, 1971).
О бщ епринятая форма сложности назы вается конфигуральной оценкой, в
которой диагностическое значение признака зависит от значения других
признаков (например “интонация его голоса не каж ется мне характерной
для человека, реш ивш его покончить ж изнь самоубийством, если звонок не
происходит рано утром”).
Две причины для конф ликта между измеренным и сообщенным суж де­
нием возникли из последующего исследования, и каж дая обладает негатив­
ными последствиями относительно полезности регрессивного моделирова­
н и я для “черпания” мудрости реш ений прошлого. Одной из них было рас­
тущ ее понимание того, что комбинирование огромного количества инфор­
мации в голове, к ак того требуют такие формулы, превыш ает вы числитель­
ную способность любого человека, кроме человека, проявляю щ его незау­
рядны е способности в узкой области знаний. Оценивающий, который пы ­
тается применить сложную стратегию , просто не сможет сделать этого пос­
ледовательно. Действительно, очень трудно вы учить и использовать даж е
неконфигуральное правило принятия реш ений с оцененной суммой, когда
сущ ествует много признаков или необычных отношений меж ду признака­
ми и прогнозируемыми переменными (Slovic, 1974).
В торая вещ ь, которая была осознана с помощью исследования случаев
из клинической практики (см. гл. 28) это то, что простые линейные модели
дают очень сильные прогнозы. П ростая субстантивная теория, показы ваю ­
щ ая, на каки е переменные люди обращают внимание при принятии реш е­
ний, - это, мож ет быть, все, что нуж но человеку для создания верного про­
гноза и х поведения. Если некоторые признаки говорят в пользу некоторого
реш ения, а другие - против него, то простое сопоставление количества одоб­
ряю щ их и опровергаю щ их признаков даст возможность точного прогноза
поведения человека. К ак бы там ни было, результатом будет более скром­
н ая теория, чем теория, которую человек мож ет вывести путем яркого мо­
делирования регрессии (Fischhoff, G oitein & Shapira, в печати). Таким об­
разом , в то врем я к а к каж ется, что мы вот-вот поймем прош лое, наш и стан­
дартны е статистические процедуры не всегда говорят нам то, что мы хотим
узнать. И если неверно их использовать, они могут завести нас не в ту сторо­
ну, сделав нас ещ е менее мудрыми, чем мы были в самом начале. Мы хотим
охватить крайне сложные теории во всей их полноте, не понимая, что их
сила исходит из очень простых основополагающих понятий, а не из пони­
м ания сущ ности прошлого.
Обреченным необходимо изучать прошлое... 387
Изучение недальновидности

В центре вним ания неудача


Поиск мудрости в исторических событиях требует веры - вера в существова­
ние повторения, ожидающего, чтобы его обнаружили. Поиск мудрости в по­
ведении исторических личностей требует несколько другого рода веры - уве­
ренности, что наш и предшественники знали вещи, которых мы не знаем. Пер­
вая из этих вер основана на философии; она отличает тех, кто рассматривает
историю к ак социальную науку, а не идеографическое исследование непов­
торимых событий. Вторая вера основана на милосердии и скромности. Она
отличает тех, кто надеется видеть дальш е, стоя на плечах у предш ественни­
ков от тех, кто удовлетворен тем, что стоит на собственных ногах. Афориз­
мов к ак - “те, кто не изучают прошлое, обречены повторить его”, - наличие
таких предпологает, что вера в мудрость наш их предшественников относи­
тельно редка.
Активное исследование недальновидности, конечно, имеет свои преиму­
щества. Людям, у которых не все получается, приходится много объяснять, но
такие объяснения очень важны для получения знаний из опыта. Осознав, по­
чему дела пошли не так, как надо, мы надеемся заставить их улучшиться в
будущем. Поиск причин неудач, чтобы объяснить их совсем не труден. Детек­
тив, журналист и историк все вовлечены в хаос. Поездка на машине в магазин
без несчастного случая, или правление без войн, депрессий, или землетрясе­
ний каж ется им небогатыми на события.
Х отя концентрация на неудаче имеет приемлемые цели, она, вероятно,
введет нас в заблуждение, создав искаж енное представление о распростра­
ненности неудачи. К аж ущ аяся вероятность событий частично определена
легкостью , с которой, они приходят на ум и вспоминаю тся (T versky и
K ahnem an, 1973,11). Часто повторяющиеся неудачи должны, поэтому, не­
пропорционально увеличить воспринятую частоту в прошлом (и возможно
будущем).
Это, такж е, вероятно продвинет несбалансированную оценку поведения
наш их предш ественников. Охотника до сенсаций, живущ его в каж дом из
нас, тянет к историям благосостоятельных ж уликов или “сверх-регулиро-
ванию ” некоторых возможностей окружаю щ ей среды, (как например, пе­
чально известный стандарт на проект сиденья унитаза для производствен­
ны х помещ ений, разработанный М инистерством Здравоохранения и Охра­
ны труда. Мы склонны забывать, тем не менее, что любая ош ибочная, но не
дьявольская, система принятия реш ения производит ош ибки обоих видов.
Д ля каждого мош енника, получающего незаслуженные выгоды, существует
одна или несколько ж ертв, которым н екая несоверш енная система отказа­
ла в правах. Ф актически, два ошибочных определения связаны отчасти не­
интуитивным образом, зависящ им от точности оценки и всех доступных ре­
сурсов, например, процент бедноты, имеющей права, или риски, которое
388 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
можно принимать (Einhorn, 1978). Перед тем, как начать критиковать систе­
му обеспечения за то, что она позволяет существование нескольких мошен­
ников, мы должны рассмотреть, много ли существует страшных историй этого
типа, учиты вая отношение ошибок исполнения к ошибкам неисполнения.
Вообще, имеется больш ая вероятность того, что человек будет введен в
заблуж дение, если мы исследуем в изоляции реш ения, которые “выраба­
ты ваю тся” только на процентном основании.

В чем же проблема?
Существуют другие контексты , в которы х ош ибки в малом могут вы гля­
деть другими, когда рассматривается более ш ирокий контекст. Н апример,
нас учат, что научные теории долж ны опровергаться, если представлено
некое противоречащ ее им доказательство. В результате, мы быстро осуж­
даем учены х, которые упорствуют в своих теориях, несмотря на то, что их
неправильность бы ла доказана. Кун (K uhn, 1962), однако, утверж дает, что
такая локальная недальновидность мож ет быть совместимой с более гло­
б ал ьн о й м удростью в п о и ск е н ауч н ого зн ан и я . Д руги е (н ап р и м ер ,
Feyerabend, 1975; L akatos, 1970), ф актически, превознесли роль дисципли­
нированной анархии в росте понимания и сомневались относительно воз­
можности появления мудрости из организованной приверженности к лю­
бому одобренному методу исследования. Они доказываю т, что неж елание
принимать во внимание противоречащ ие данные или отказаться от очевид­
но опровергнутых теорий часто необходимо для научного прогресса.
Ш траф в 125 миллионов долларов, налож енны й на автомобильную Ком­
панию “Ф орд” в случае с моделью “Пинто” (P into), сделал реш ение компа­
нии сэкономить несколько долларов на дизайне топливного бака автомоби­
л я очень недальновидным. Все ж е в чисто экономических терминах, гаран­
тируемая экономия, скаж ем , 15 долларов на каж дом из 10 миллионов “П ин­
то” делает риск нескольких больших исков похожим на более разумную азар­
тную игру. Так к ак в приговоре в этом хорошо освещенном в средствах мас­
совой информации иске сумма была уменьш ена до 6 миллионов долларов
после аппеляции, ком пания ф актически вы гадала в строгих экономичес­
ки х терминах, несмотря на то, что ситуация ухудш илась. В чем был промах
ком пании, так это в рассмотрении одного контекста (количество автомоби­
лей, на которы х можно было сэкономить деньги), а не другого (неэкономи­
ческие последствия ее реш ения). К омпания, видимо, не поняла влияния,
которое неблагоприятное общественное мнение оказало бы на образ “Фор­
да” к ак производителя автомобилей, заботящ егося о надежности, или на
цены за используемый “П инто” (хотя эту цену “П инто” платил владелец, а
не производитель).
Если осуждение - это название игры , ош ибка - это ош ибка. Все ж е, если
вы заинтересованы в получении знаний из опыта других, важ но определить
то, какую проблему вы пы тались реш ить. После осторожной проверки, мно-
Обреченным необходимо изучать прошлое... 389
гае очевидные ош ибки, оказы вается, представляю т свежее решение непра­
вильной проблемы. Например, если это может критиковаться вообще, ком­
пания Форд могла бы быть объявлена виновной в тактической мудрости и
стратегической недальновидности (или возможно в предпочтении здоровья
социальному благосостоянию).
Это различие важно не только для оценки прошлого, но такж е и для знания,
какие корректирующие меры должны быть приняты в будущем. Обычно, так­
тические ошибки легче исправить, чем стратегические недоразумения. Как
только мы должным образом охарактеризовали ситуацию, мы можем завести
“книгу”, в которую будем записывать обычную мудрость как накопленную с
эмпирическим опытом, или, по крайней мере, формулы для оптимального объе­
динения информации, имеющейся в нашем распоряжении (H exter, 1971). Ме­
неджеры в бейсболе либо знают, что лучше заменить отбивающего бегуном на
первой игре и не заменять в игре на равных, либо применят статистику, чтобы
вычислить, как “получить проценты”. Эти руководящие принципы, однако,
бесполезны или вводят в заблуждение, если реальная проблема, которая долж­
на быть решена - это утверждение морали (бегун имеет шанс вести лигу на за­
няты х базах) или помощь билетной кассе (болельщики должны видеть некото­
рую интригу). Исследования неожиданных нападений в международных от­
ношениях показывают, что нации, которых заставали врасплох, часто хорошо
играли по своей книге, но неправильно определяли поле, на котором они игра­
ли (BenZvi, 1976; Lanir, 1978). В некотором смысле, они читали неправильную
книгу; чем лучше они читали, тем быстрее они проигрывали.
Одна причина для трудности, поставленной стратегическими проблемами -
то, что их нужно “продумывать” аналитически, не используя преимуществ со­
вокупного (статистического) опыта. Второе ограничение - это то, что неправиль­
ные представления часто широко разделяются в пределах принимающей ре­
ш ения группы или сообщества. С человеком консультируются относительно
решения только после того, как он закончил отвечать на вопросы в книге. Реко­
мендуемые советы для учреждений, заинтересованных в избегании неожидан­
ностей : (а) основывайте несколько отдельных аналитических групп, чтобы обес­
печить многократные, независимые взгляды на проблему, или (Ь) назначьте
человека, который служил бы “адвокатом дьявола” для непопулярных точек
зрения (Janis, 1972). Практически, первая стратегия может потерпеть неуда­
чу, потому что распространенные неправильные представления делают груп­
пы очень похожими друг на друга, создавая скорее избыточность, чем плюра­
лизм (Chan, 1979). Второй пункт терпит неудачу, потому что адвокаты либо
склоняю тся под давлением группы, либо подвергаются гонениям, если они
принимают свои непопулярные позиции всерьез, даже, когда эти “крайние”
позиции радикально не противоречат мнениям группы.
Неспособность отличить тактические решения от стратегических могут так­
ж е создать неоправданную иллюзию мудрости. Банки и страховые компании
обычно считаются чрезвычайно рациональными и ловкими в процессах при­
нятия решений. Все ж е более пристальное рассмотрение показывает, что эта
390 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
репутация происходит из их успеха в создании часто повторяющихся, такти­
ческих решений, в которых они почти не могут проигрывать. Ссуды под залог
недвижимости и страхование ж изни рассматриваются на основе консерватив­
ны х интерпретаций статистических таблиц, приобретенных и отрегулирован­
ны х с помощью массивного опыта проб и ошибок. Попытки этих учреждений
принимать спекулятивные решения, требующие аналитических, стратегичес­
ких решений, говорят о том, что они - не умнее, чем все мы. Коммерческие
банки потеряли большие суммы денег в 60-ых, благодаря необдуманным инве­
стициям в тресты недвижимости; подобный небольшой процент их всех реше­
ний в 70-ых приковал экономику США к будущему полукредитоспособных
стран Третьего мира, которым были сделаны большие займы (более $ 60 мил­
лиардов). (Хотя эта связь может быть оправдана пользой для всего человече­
ства, которая вовсе не была проблемой, которую решали банки.) Медленный и
беспорядочный ответ страховых компаний на изменения в экономике страхо­
вания несчастных случаев; и их почти случайные, неаналитические методы
для многих необычных рисков должны заставить нас почувствовать себя не
такими недальновидными по сравнению с этими превозносимыми учрежде­
ниями.

Ретроспектива: Размышление над прошлым?


Если мы знаем то, что случилось и какую проблему человек пробовал решать,
мы должны применить мудрость наш ей собственной ретроспективы в объяс­
нении и оценке его поведения. После более тщательной экспертизы, однако,
преимущества знания того, как идут дела, могут быть переоценены (Fischhoff,
1975). В ретроспективе, люди последовательно преувеличивают то, что могло
ожидаться в будущем. Они не только имеют тенденцию рассматривать то, что
случилось как неизбежное, но такж е и рассматривать это как оказавшееся “от­
носительно неизбежным” прежде, чем это случалось. Люди полагают, что дру­
гие должны прогнозировать события намного лучше, чем это есть на самом деле.
Они даже неправильно запоминают свои собственные прогнозы, чтобы преуве­
личивать в ретроспективе, что они знали заранее (Fischhoff и Beyth, 1975).
К ак описано историком Георгесом Флоровским (Georges Florovsky, 1969):
Тенденция к детерминизму, так или иначе, подразумевается в самом методе ретроспекти­
вы. Ретроспективно, мы, кажется, чувствуем логику событий, которые разворачиваются
регулярным или линейным образом согласно распознаваемому образцу с предполагаемой
внутренней потребностью. Так, чтобы мы получили впечатление, что это событие действи­
тельно не могло произойти по-другому, (стр. 369)

Подходящим названием для этой тенденции рассматривать исходы, о которых


было сообщено, как об относительно неизбежных, могло бы быть “пресмыкаю­
щийся детерминизм”, в отличие от философского детерминизма, сознатель­
ного убеждения, что все, что происходит, должно случиться.
Обреченным необходимо изучать прошлое... 391
Одна из тенденций - сократить пропорцию исторических процессов, уве­
личивая скорость, с которой “неизбеж ны е” изм енения осущ ествляю тся
(Fischer, 1970). Например, люди способны указать на момент, когда ж ители
Латифундии были обречены, не понимая, что им потребовалось два с полови­
ной столетия, чтобы исчезнуть. Д ругая тенденция состоит в том, чтобы по­
мнить людей, более похожими на себя настоящ их, чем фактически это было
так (Y arrow, Campbell, и B urton, 1970). Третья тенденция может быть заме­
чена в критическом анализе историографии идеологических корней нациз­
ма Барраклау ( B arraclough, 1972). Оглядываясь назад от времен Третьего
Рейха, можно проследить его корни в работах многих авторов, из чьих произ­
ведений нельзя было вывести нацизм. Четвертая тенденция - это думать, что
участники исторической ситуации полностью осознавали ее возможную важ ­
ность (“Дорогой дневник, сегодня началась Столетняя война”, Fischer, 1970).
П ятая тенденция - это миф критического эксперимента, недвусмысленно ре­
шающего конфликт между двумя теориями или устанавливая валидность
одной. Ф актически, “критический эксперимент считается критическим толь­
ко десятилетия спустя. Теории не отменяются просто так, так как несколько
аномалий всегда позволяю тся. Действительно, очень трудно опровергнуть
программу исследования, которую поддерживают талантливые ученые с раз­
витым воображением” (Lakatos, 1970, с. 157-158).
Неспособность игнорировать знание исхода имеет существенные выго­
ды. Весьма лестно считать, или заставлять других полагать, что мы знали
бы все, что мы могли бы только знать со знанием исхода, то есть, что мы
обладаем ретроспективным предвидением. В конечном счете, однако, необ­
наруж енны й пресмы каю щ ийся детерминизм мож ет серьезно повредить
наш ей способности оценивать прош лое или получать из него знания.
Рассмотрим людей принимаю щ их реш ения, которые оказались негото­
выми к некоторому повороту событий и которые пробуют увидеть, где они
повели себя не так, к ак надо, воссоздавая состояние знания пред-исхода.
Если ретроспективно событие каж ется относительно вероятным, они не сде­
лаю т ничего, кроме к ак , будут ругать себя за то, что они не соверш или дей­
ствия, которое их знание, каж ется, диктовало. Они могли бы добавить со­
ж аление об ущербе, причиненном самим событием. Когда прошлое пере­
сматривается наблюдателем, их неудача каж ется проявлением некомпетен­
тности, недальновидности, или ещ е хуж е.
В ситуациях, когда информация ограничена и неопределенна, случай­
ные неожиданности и конечные неудачи неизбежны. Н аказы вать людей
принимающ их реш ения, которые допустили ошибку в подверженным ошиб­
кам системах, не признавая этого и ничего не делая, чтобы улучш ить систе­
му, является несправедливым и пагубным. Согласно историку Роберте Воль-
ш теттер (R oberta W o h lstetter, 1962), урок, который получен из неож идан­
ного нападения в Перл Х арборе-то, что мы должны “принять ф акт неопре­
деленности и учиться ж ить с ним. Так как никакое волшебство не обеспе­
чит определенность, наш и планы должны работать без нее” (с. 401).
392 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
Когда мы пы таемся понимать прош лые события, мы неявно проверяем
гипотезы или правила, которые мы используем, чтобы интерпретировать и
понимать мир вокруг нас. Если, в ретроспективе, мы систематически недо­
оцениваем случаи неожиданности, которые были и есть у прошлого для нас,
мы подвергаем эти гипотезы очень слабым тестам и, возможно, находим мало
причин изменить их. Таким образом, само знание исхода, которое дает нам
чувство того, что мы понимаем то, что прошлое хотело нам сообщить, мо­
ж ет помеш ать нам действительно вынести и з него какой-либо урок.
Защ ита от этого предубеждения требует некоторого понимания психоло­
гических процессов, задействованных в его создании. К аж ется, что когда мы
получаем знание исхода, мы немедленно понимаем его, интегрируя в то, что
мы уж е знаем о предмете. После такой переинтерпретации, сообщенный ис­
ход каж ется более или менее неизбежным продуктом переинтерпретирован­
ной ситуации. “Понимание” того, что нам говорят о прошлом, в свою очередь,
настолько естественно, что мы можем не знать, что знание исхода оказывало
какое-либо влияние на нас. Д аж е если мы знаем, что влияние было, мы мо­
жем все еще точно не сознавать, каким оно было. В попытке восстановить
наш е ретроспективное состояние, мы остаемся закрепленными в наш ей рет­
роспективе, оставляя рассматриваемый исход слиш ком вероятным.
В результате, просто предупреждение людей относительно опасностей
предубеждения ретроспективы не имеет влияния (Fischhoff, 1977b). Более
эф ф ективная манипуляция долж на вынудить человека приводить доводы
против неизбежности сообщенных исходов, то есть попы таться убедить, что
это могло бы получиться иначе. Вопрос о валидности причин, которые вам
потребовались для объяснения его неизбеж ности, мог бы бы ть хорошим
началом (K oriat, L ichtenstein, и Fischhoff, 1980; Slovic и Fischhoff, 1977).
Так к ак даж е этот необычный ш аг, каж ется не полностью адекватным, м ож ­
но было далее пробовать проследить часть неопределенности, окружаю щ ей
прош лые события в их первоначальной форме. Существуют ли расш ифров­
ки стенограммы командованию П ерл Харбора до 7 часов утра 7 декабря?
Существует ли записная кн иж ка, показы ваю щ ая акции, которые Вы рас­
смотрели до покупки акций Волтем Индастриз? Существуют ли дневники,
показы ваю щ ие взгляд Чемберлена на Гитлера в 1939? Интересным вариан­
том было намерение Д угласа Ф римана не знать ничего о последующих со­
бы тиях на любом отрезке времени при его работе над биографией Роберта Е .
Л и. Х отя это и замечательно, эта стратегия все-таки требует некоторых пред­
полож ений о распространенности знания относительно того, кто сдался в
Аппоматоксе.
Обреченным необходимо изучать прошлое... 393
Взгляд на все сразу

Зачем вообще смотреть?


Изучение прошлого основано на убеждении, что, если мы смотрим, мы бу­
дем способны разглядеть некоторые поддающиеся интерпретации модели.
Обширное исследование полагает, что это убеждение хорошо обосновано.
Люди, каж ется, имеют замечательную способность находить некоторый по­
рядок или значение даж е в случайно произведенных данных. Один из наи­
более знакомы х примеров - ош ибка игрока в казино. Мы считаем, что при
подбрасывании монеты, четыре последовательных “орла” будут сопровож­
даться “реш кой” (Lindm an и Edw ards, 1961). Таким образом, в наш их умах
даже случайные процессы вынуждены иметь внутренние свойства. Кане-
ман и Тверски (1972b, 3) предположили, что из 32 возможных последова­
тельностей ш ести бинарных событий только 1 практически рассматривает­
ся к ак “случайная”.
Х отя ош ибка игрока в казино обычно упоминается в контексте пикант­
ны х, но тривиальны х примеров, она может такж е быть найдена в более се­
рьезных попы тках объяснить исторические события. Н апример, после от­
четливой демонстрации того, что вакансии в Верховном Суде распределя­
ются более или менее случайно (согласно процессу Пуассона), с вероятнос­
тью 0.39, по крайней мере, одной вакансии в год, Моррисон (M orrison, 1977)
потребовал, чтобы
(Президент) Рузвельт объявил свой план созыва Суда в феврале 1937, вскоре после на­
чала своего пятого года правления в Белом доме. 1937 был также годом, в котором он
сделал свое первое назначение в Суд. То, что он имел эту возможность в 1937, не должно
было бы показаться удивительным, потому что вероятность, что он в течение пяти лет
не назначал бы одного или более судей, была всего лишь 0.08, или один к двенадцати.
Другими словами, когда Рузвельт решил изменить Суд, создав дополнительные места,
вероятность была уже одиннадцать к одному в его пользу, что он сможет назвать одного
или более судей традиционным способом именно в этом году. (с. 143-144)

Однако, если вакансии появляю тся наугад, то это рассуждение неправиль­


но. Оно предполагает, что вероятностный процесс, создающ ий вакансии,
подобно монете, имеет пам ять и чувство справедливости, как будто он зна­
ет, что он переходит в пяты й год правления президента Рузвельта и что он
“долж ен” Ф .Д .Рузвельту вакансию . Однако, 1 января 1937 прош лые четы ­
ре года были историей, и вероятность, по крайней мере, одной вакансии в
наступающ ем году была все еще 0.39 (Fischhoff, 1978).
Ф еллер (Feller, 1968) предложил следующий рассказ, вовлекающ ий даже
более вы сокие ставки: ж ители Лондона в течение бомбардировок потратили
значительны е усилия на интерпретации зон немецкой бомбежки, развитие
слож ны х теорий того, куда немцы целились (и когда снимать маскировку).
Однако, когда Лондон был разделен на маленькие, смежные географичес­
кие области, распределение частоты попаданий бомб в область было почти
394 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
точным приближ ением к пуассоновскому распределению . Кейтс (K ates,
1962) предполагает, что природные бедствия составили другую категорию
важ ны х событий, где (напуганные) обыватели, видят порядок, когда экс­
перты видят случайность.
Одна загадка устойчивости таких убеждений - неспособность продолжать
использовать достаточно полные записи, чтобы противостоять ош ибкам. Ис­
торики подтверждаю т, что роль отсутствующего свидетельства в облегче­
нии объяснений с комментариями, таким и, к ак “история Викторианской
Эпохи никогда не будет написана. Мы знаем слиш ком много относительно
ее. Т ак к ак невежество - первая необходимая вещ ь для историка - невеж е­
ство, которое упрощ ает и разъясняет, которое выбирает и пренебрегает, со
спокойны м соверш енством, недосягаемы м самым вы соким искусством”
(Strachey, 1918, предисловие).
Д аж е, если записи доступны и неизбеж ны , мы, каж ется, имеем необыч­
ную способность объяснять или обеспечивать причинную интерпретацию
для всего, что мы видим. Когда события обусловлены вероятностными про­
цессами с неосязаемыми свойствами, случайное изменение не мож ет даж е
казаться нам потенциальной гипотезой. Н апример, тот ф акт, что атлеты ,
наказы ваем ы е за плохое выступление, имеют тенденцию добиваться боль­
ш его успеха в следующ ий раз, удовлетворяет наш им наивным теориям о
поощ рении и наказании. Это удобное объяснение ослепляет нас по отноше­
нию к вероятности того, что улучш ение наоборот, происходит благодаря рег­
рессу к среднему в выступлении атлетов (Furby, 1973; K ahnem anи T versky,
1973,4).
Ф ама (Fam a, 1965) действительно считал, что колебания цен на фондо­
вой бирже лучш ие поняты к ак отраж ение случайного процесса. Случайный
процесс, однако, имеет даже более неинтуитивные свойства, чем двоичный
процесс, с которым он формально связан (C arlsson, 1972). В результате, мы
обнаруж иваем, что рыночные аналитики имеют объяснение каж дого изме­
нения в цене, преследующее некоторую цель или нет. Некоторые объясне­
н и я, подобно показанны м на рис.1, являю тся противоречивыми2; другие,
каж ется, отрицаю т возможность случайного компонента, например, пол­
ностью выдуманный фактор “техническое регулирование.”
Псевдовласть наш их объяснений может быть проиллюстрирована по ана­
логии с анализом регресса. Учитывая набор событий и достаточно большой или
богатый набор возможных объясняющих факторов, можно всегда получать
постдикции или объяснения для любой желаемой степени плотности. В терми­
нах регресса, расш иряя набор независимых переменных можно всегда найти
нескольких прогнозирующих с любой желаемой корреляцией с независимой
переменной. Цена, которую приходится платить за чрезмерную совместимость,

2Один из моих любимых контрастов - это, когда рыночные цены повышаются после хоро­
ших экономических новостей, то это считается ответом на новости; если же они падают, это
объясняется, тем, что хорошие новости уже были обесценены.
Обреченным необходимо изучать прошлое... 395
конечно, сокращение, неспособность полученного правила работать на новой
выборке событий. Частота и сила методологических предупреждений против
чрезмерной совместимости предполагают, что корреляционное применение
избыточной мощности - это предубеждение, которое является весьма стойким
даже к расширенному профессиональному обучению (для ссылок, см. Fischhoff
и Slovic, 1980).
Теория чрезмерной совместимости подобна костюму, скроенному точно для
одного человека в одной специфической позе, который не подойдет кому-либо
еще или даже, тому же самому человеку в будущем или даже в настоящем,
если у него происходит некоторое заметное изменение (например, если он
делает выдох, чтобы показать живот). Историк, который построил гермети-

L
Уровень накопления

КАК ФОРМИРУЮТСЯ СОПРОТИВЛЕНИЯ

КАК ФОРМИРУЕТСЯ ПОДДЕРЖКА

Рис. 1. Два примера признаков, используемых в выделении пред­


ш ественников прош лы х изменений в ценах акций: формирование
сопротивления и формирование поддержки. Однако можно видеть,
что до серьезных изменений, эти два образца были по существу иден­
тичны . В этом свете, волнообразный отрезок ни прогнозирует, ни
объясняет ничего в этих данны х
396 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
ческий случай, объясняющий все доступные свидетельства, как могли бы по­
бедившие большевики оказаться в грустном положении, если бы СССР рассек­
ретил документы, показывающие, что меньшевики были более серьезные про­
тивники, чем думали раньше. Цена, которую инвестиционные аналитики пла­
тят за чрезмерное совпадение - их неспособность в конце концов предсказать
ничего лучш е, чем средние рыночные числа (Dreman, 1979) - хотя циник мог
бы сказать что они фактически выживают через поколение надежды (и комис­
сии). 3
Чрезмерное совпадение происходит из-за капитализации на случайны х
колебаниях. Если измерение достаточно точное, два случая, отличаю щ ие­
ся одной переменной, такж е будут отличаться любой другой переменной,
которую мы хотим назвать. В результате, можно вы числить отличную от
н уля (ф актически, в этом случае, совершенную) корреляцию меж ду этими
двум я переменными и получить “интересную ” самостоятельную теорию.
Процессы, аналогичны е этому двух-размерному случаю, работают с любы­
ми т наблю дениями в п-мерном пространстве, определенном наш им набо­
ром возмож ны х объясняю щ их концепций.
В этих прим ерах, данные заданы и бесспорны, в то время к ак набор воз­
мож ны х объяснений относительно неограничен; человек ищ ет до тех пор,
пока не находит объяснение, которое его удовлетворяет. Д ругая популяр­
н ая форма капитализации на случае оставляет набор установленных объяс­
нений (обычно для одного кандидата) и перебирает данные до тех пор, пока
подтверждаю щ ее свидетельство не найдено. Х отя более грубая форма этой
процедуры хорошо известна, другие формы являю тся более тонкими и даж е
несколько неоднозначными в своей характеристике. Н апример, Вы прово­
дите эксперимент и не получаете ожидаемы й результат. Д умая об этом, Вы
обращ аете внимание на элемент ваш ей процедуры, который мог уменьш ить
влияние зависимой переменной. Вы исправляете это; снова нет результата,
снова возникает возмож ная проблема. Н аконец, Вы (или ваш и испытуемые)
получаете все, к ак надо, и ожидаемый эффект получен. Теперь, правильно
ли вы полнить ваш е статистическое испы тание на этой энной выборке (для
которой оно значимо) или на всех выборках? Если бы Вы сделали правиль­
ный эксперимент сначала, вопрос даж е не будет возникать. И ли, к ак токси­
колог, Вы “уверены”, что воздействие химического вещ ества X является
вредным для здоровья, так что Вы сравниваете рабочих, которые работают
и не работают с ним на некотором заводе на наличие рака мочевого пузы ря,
но все ещ е не получаете никакого результата. Так что Вы проверяете их на
рак киш ечника, эмфизему, головокруж ение, и так далее, пока Вы наконец
не получаете существенное различие в наличие рака кож и. Это различие

3Мой друг однажды проходил курс по чтению форм диаграмм в сфере маклерства. Каждое
занятие включало обучение 10-12 новым признакам. Когда курс закончился, через пять
занятий и 57 признаков, у преподавателя осталось еще много в запасе.
Обреченным необходимо изучать прошлое... 397
значимое? Конечно, способ проверить эти объяснения или теории - испы та­
ние с новыми выборками. Этот ш аг, к сожалению , редко предпринимается
и часто не возможен по техническим или этическим причинам (Tukey, 1977).
Связанные ослож нения могут возникать даж е с установленными теори­
ями и наборами данных. Диаконис (D iaconis, 1978, с. 132) отмечает труд­
ность оценки количества неожиданностей в результатах экстрасенсорного
восприятия, даж е в редких случаях, в которы х они были получены в конт­
ролируемой обстановке, потому что определения нужного события продол­
ж аю т изм еняться. “Главный клю ч к успеху Б.Д . было то, что он не опреде­
лял заранее результат, который нуж но рассматривать к ак неожиданный.
Разногласия против некоторого совпадения существенно меньш е, чем про­
тив любого заранее определенного совпадения”.4
Туфт и Сан (T ufte и Sun, 1975) обнаруж или, что существование или от­
сутствие пределов зависит от творческого потенциала и гибкости, допуска­
емой в определении события (для какого офиса? на каки х выборах? насколь­
ко хорошо? пределы, которые отсутствуют, должны быть вклю чены?). Они,
как полагаю т, существуют, потому что мы имеем удивительную способность
обнаружить сигнал даж е в полном ш уме.

М ы уже достаточно увидели?


У читы вая, что мы почти уверены относительно обнаруж ения чего-то под­
дающ егося толкованию , когда мы смотрим на прош лое, наш следующий
вопрос такой, “П оняли мы его?” Исследование ретроспективы, описанное
ранее, предполагает, что мы не только быстро находим порядок, но такж е и
чувствуем, что мы знали это все некоторым способом или были бы способны
спрогнозировать результат, если нас вовремя попросили бы. Действитель­
но, легкость, с которой мы обесцениваем информативность того, что нам
говорят, делает удивительным то, что мы когда-либо задаем прош лому, или
любому другому источнику, много вопросов. Эта тенденция усугубляется
за счет (а) не понимания того, к ак мало мы знаем или того, что нам говорят,
оставляя нас не сознающ ими то, каки е вопросы мы долж ны задать в поиске
неож иданны х ответов (F ischhoff, Slovic и L ichtenstein, 1977,1978) и (b) по­
рож дения далеко идущ их заклю чений даж е из малого количества ненадеж ­
ны х данны х (K ahnem an и Tversky, 1973 ,4 ; Tversky и K ahnem an, 1971,2).
Любая склонность не смотреть дальше поощряется нормой сообщения ис­
тории, к ак хорошей истории, со всеми уместными подробностями, аккуратно
объясненными и неопределенностью, окружающей событие до его завершения,

4Диаконис продолжает, “Чтобы далее усложнить любой анализ, несколько таких неточно
определенных экспериментов часто проводились одновременно, взаимодействуя друг с дру­
гом. Молодой исполнитель держал аудиторию в напряжении. Его часто полностью невер­
ные предположения вообще расценивались скорее с симпатией, чем сомнением; и для боль­
шинства наблюдателей они, казалось, только подтверждали наличие сверхъестественных
способностей у Б.Д.”
398 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
наряду с любым сметением, который автор, возможно, чувствовал (Gallie, 1964;
N ow ell-Sm ith, 1970). Только одна из тайн этого явлен и я раскры та Тауни
(Tawney, 1961); “Историки приписывают появление неизбежности существу­
ющему порядку, выдвигая на первый план силы, которые одержали победу и
отодвигая на задний план те, которые они проглотили”(с. 177).5
Х отя это и интуитивно привлекательная цель, построение последователь­
ны х рассказов подвергает читателя некоторым интересным предубеждени­
ям . Законченны й рассказ состоит из ряда независимы х звеньев, каж дое
довольно хорошо определено. П равда рассказа зависит от правды звеньев.
Вообще, чем большее количество звеньев появляется, и большее количество
деталей находится в каж дом звене, тем менее вероятно, что история долж ­
на быть правильной в ее полноте. Однако Словик, Ф ишхофф и Л ихтенш ­
тейн (Slovic, Fischhoff и L ichtenstein, 1976)наш ли,что добавление д етали к
описанию события может увеличивать его каж ущ ую ся вероятность возник­
новения, очевидно, увеличив его тематическое единство. Бар-Х иллел (Ваг-
H illel, 1973) обнаруж ила, что люди последовательно преувеличиваю т веро­
ятность конъю нкции ряда вероятны х событий. Н апример, ее испытуемые
вообще предпочитали ситуацию , в которой они получат приз, если семь не­
зависимы х событий, каж дое с вероятностью 0.90 долж ны произойти, ситу­
ации, в которой они получат тот ж е самый приз, если при подбрасывании
монеты вы пал “орел”. Вероятность сложного события меньш е чем 0.50, при­
ним ая во внимание, что вероятность единственного события - 0.50. Други­
ми словами, неопределенность, каж ется, нарастает в медленном темпе.
Что случается, если последовательность вклю чает одно или несколько
слабы х или маловероятны х звеньев? Вероятность его самого слабого звена
долж на установить верхний предел вероятности полного рассказа. После­
довательные суж дения, однако, могут быть компенсационными, с последо­
вательностью сильны х звеньев “выравниваю щ их” бессвязность слабых свя­
зей. Этот эффект используется адвокатами, которые помещают самое сла­
бое звено в их аргументах рядом с началом их выводов и заканчиваю т пото­
ком убедительных, неоспоримых аргументов.
Коулс (Coles, 1973) предоставил восхитительный пример полной последо­
вательности истории, скрывающей неправдоподобность ее звеньев: наиболее
серьезная попы тка Ф рейда в психоистории была составить биографию Лео­
нардо да Винчи. В течение многих лет, Фрейд искал тайну, позволяющую
понять Леонардо, чье детство и юность были в основном неизвестны. Н ако­
нец, он обнаружил ссылку Леонардо на воспоминание о стервятнике, касаю ­
щ емся его губ, в то время к ак он был в колыбели. Отмечая идентичность еги­
петских иероглифов для “стервятника” и “матери” и другого свидетельства,
Ф рейд продолжал строить внуш ительный и последовательный анализ Лео­

5Такие стратегии могут затрагивать дух, также как и разум, субъективно увеличивая силу
и стабильность статуса-кво и сокращая его очевидную способность к изменению (Markovic,
1970).
Обреченным необходимо изучать прошлое... 399
нардо. При составлении окончательного издания работ Фрейда, однако, ре­
дактор обнаружил, что немецкий перевод воспоминания Леонардо (первона­
чально по-итальянски) который использовал Фрейд, был ошибочным, и что
это был бумажный змей, а не стервятник, который гладил его губы. Несмот­
ря на наличие клю ча к разрушению анализа Ф рейда, редакторы реш или, что
остающийся каркас был достаточно прочен, чтобы выстоять это. К ак Хек-
стер заметил (H exter, 1971, с. 59), “Частично, потому что написать плохую
историю довольно легко, хорошие истории пиш утся очень редко”.

Заклю чен и е
К акие общие уроки мы можем извлечь из изучения прошлого, за исклю че­
нием ф акта, что понимание является более неуловимым, чем это может быть
часто подтверждено?

П резент изм(приверж енност ь наст оящ ему)


Неизбежно, мы все пленники наш ей существующей личной перспективы.
Мы знаем вещ и, которые наш и предш ественники не знали. Мы используем
аналитические категории (например, феодализм, Столетняя война), кото­
рые являю тся значимыми только ретроспективно (Е. A. R. Brown, 1974).
Мы обладаем собственными точками зрения при интерпретации прошлого,
чтобы доказать, что оно является неоднозначным, чтобы избеж ать налож е­
ния наш ей идеологической перспективы (D egler, 1976). И сторики действи­
тельно “использую т новые ф окусы на м ертвы х в каж дом поколении”
(Becker, 1935).
Не существует никакого доказанного противоядия для презентизма. Не­
которые частичны е средства могут быть обобщены из обсуждения того, как
избеж ать предубеждения ретроспективы при пересмотре прошлого. Другие
появляю тся в почти любом тексте, посвящ енном обучению историков. Воз­
можно, наиболее общими выводами, являю тся, (а), знание нас самих и на­
стоящ его настолько хорошо, насколько возможно; “историк, который боль­
ш е всего ощ ущ ает собственную ситуацию , такж е наиболее способен к ее
трансцендированию ” (B enedetto Croce, цитируемый C arr, 1961, с. 44); и (Ь)
быть настолько благож елательны ми, насколько возможно, по отношению
к наш им предш ественникам; “историк - не судья, ещ е меньш е вешающий
судья” (Knowles, цитируемый M arw ick, 1970, с. 101).

П едант ичност ь
В дополнение к неизбежному заклю чению в рам ках наш его времени, мы
часто ещ е больше ограничиваем наш у перспективу, добровольно надевая
ш оры, которые сопровождают строгую приверженность единственному н а­
учному методу. Д аж е когда он используется рассудительно, ни один метод
400 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ
не является адекватным для ответа на многие вопросы, которые мы задаем
прош лому. Каждый сообщает нам что-либо и несколько вводит в заблуж де­
ние. Когда мы не знаем, к ак получить правильны й ответ на вопрос, необхо­
дим а альтернатива эпистемологии: используйте по возможности ш ирокий
диапазон методов или перспектив, каж ды й из которых позволяет вам избе­
ж ать некоторых видов ош ибок. Это означает своего рода меж дисциплинар­
ное сотрудничество и отношение, отличное от того, с которым люди сталки­
ваю тся в большинстве попыток смеш ать два подхода. Совпадения или не
совпадения, подобно психоистории, слиш ком часто предпринимаю тся за­
щ и тн и кам и, нечувствительны м и к ловуш кам в их приняты х областях
(F ischhoff, в печати - Ь). Х екстер (H exter, 1971, с. 110) описывает истори­
ков, вовлеченных в некоторые такие приклю чения к ак “кры сы , прыгаю ­
щ ие с борта интеллектуально тонущего корабля” .

Обсуждение
Возвращ аясь к Бенсону (Benson, 1972), если мы хотим, чтобы прошлое слу­
ж ило будущему, мы не можем обращ аться с ним в изоляции. П равила, кото­
ры е мы используем, чтобы объяснить прошлое, должны такж е быть теми,
которые мы используем, чтобы прогнозировать будущее. Мы должны нако­
пить опыт, обращ ая внимание на все уместные испытания наш их гипотез.
Один аспект выполнения этого компилирует отчеты, которые могут быть под­
вергнуты систематическому статистическому анализу; второй - хранит след
обсуждения, предшествующего наш им собственным решениям, понимая, что
настоящ ее будет скоро прошлым и что хорошо сохраненное описание являет­
ся лучш им средством предотвращ ения предубеждения ретроспективы; тре­
тий делает прогнозы, которые могут быть оценены; один тревожащ ий урок
из ядерной катастрофы на острове Три Майлс - то, что не в полне ясно, что
этот якобы диагностический случай показал нам относительно валидности
Исследования атомной безопасности (А мериканская Комиссия по атомному
урегулированию, 1975), которое попыталось оценить угрозы ядерной энер­
гии: четвертый аспект получает лучш ую идею относительно валидности н а­
ш их собственных чувств достоверности, поскольку уверенность в существу­
ющем знании управляет наш ей ж аж дой новой информации и интерпрета­
ций (Fischhoff, Slovic и Lichtenstein, 1977). Таким образом, мы должны струк­
турировать наш у ж изнь, чтобы облегчить обучение.

Н еопределенност ь
В конце, тем не менее, не может быть н икаких ответов на многие из вопро­
сов, которы е мы излагаем. Н екоторые плохо сформулированы. Н а другие
н ельзя ответить с помощью сущ ествую щ их или возможных инструментов.
Столько, сколько мы хотели бы знать “к ак профессионалы делают это”, не
сущ ествует статистического способа смоделировать образ суж дения экспер­
Обреченным необходимо изучать прошлое... 401
тов до желательной степени точности с реальными стимулами. Наши теории
часто “настолько сложные, что никакая отдельная количественная работа не
могла даже начать проверять их валидность” (O’Leary и другие, 1974, с. 228).
Когда группы, которые мы хотим сравнить по одной переменной, такж е от­
личаю тся по другой, не существует логической процедуры для приравнива­
ния их на этой мешающей переменной (МееЫ, 1970). Когда мы попробовали
применить много возможных объяснений к одному набору данных, не суще­
ствует твердого способа узнать, сколько степеней свободы мы использовали,
и как мы капитализировали случайности (Champbell, 1975). Когда мы исполь­
зуем множественные подходы, знание, которое они производят, никогда точ­
но не конвергирует. В конце концов, можно попытаться применить философ­
скую перспективу Тревельяна, что “несколько несовершенных подходов к
истории - это лучш е, чем ни одного” (по М арвик, 1970, стр. 57).
Часть VII
Многоступенчатая оценка
24. Оценка составных вероятностей в
последовательном выборе*

Джон Коэн, Е. Я. Чесник иД. Харан

Часто бывают ситуации, в которых успеш ный исход зависит от человека,


делающего правильны й выбор на каж дой из нескольких более или менее
независимых стадий. В качестве примера можно привести выбор транспор­
та на различны х стадиях соверш ения поездки. Похожие затруднительные
моменты встречаю тся в профессиональной, административной, политичес­
кой, военной ж изни и в коммуникационны х сетях вообще. Временной по­
рядок этих нескольких выборов - не всегда жизненно важ ны й ф актор. Кро­
ме того, ситуация в целом может иметь стохастический характер, где веро­
ятность правильного выбора мож ет изм еняться от стадии к стадии.
Мы опиш ем эксперимент, моделирую щ ий этот общий тип ситуации, ко­
торая ясно требует, для успешного исхода, умнож ения вероятностей. И с­
следования предпочтения определения местонахождения цели в матрице
т х п, или в дисплее, разделенном на концентрические зоны, указы ваю т,
что ячейки в матрице или концентрических зонах субъективно не равнове­
роятны к ак местоположения для цели (Cohen, Boyle и Chesnick, 1969). И с­
пытуемые, каж ется, не наугад определяю т неизвестное местоположение
цели. И х стратегия поиска скорее имеет характер “предсказания”, где экс­
периментатор скры л цель, или располож ил там, где они ож идали ее уви­
деть. Другие эксперименты (Cohen и H ansel, 1958) предполагаю т, что мно­
гие люди при столкновении с ситуацией, вовлекаю щ ей сложные вероятно­
сти, склонны склады вать, а не умнож ать, возможности на различны х ста­
диях.
Мы можем соответственно спрогнозировать, что в матрице т хп, с неиз­
вестной целью в каж дом из т рядов, оценка испытуемого его вероятности
угадать все цели будет правильно преувеличена, как оцененная сложной

*Эта глава первоначально появилась в Nature, 1971, 32, 414-416. Авторское право ® 1971
Macmillan Journals, Ltd. Переиздано в соответствии с разрешением.
406 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
вероятностью , n'm, расположения цели. Наш эксперимент предназначен для
проверки этого прогноза и объяснения явлений, которые возникнут в ситу­
ации.

Таблица 1. Психологические вероятности (гр\ основанные на выборе в ло­


терее
Количест во
Количест во ст адий в м ассиве
альт ернат ив в ст адии
2 3 4 5 8 М
2 0.45 0.51 0.36 0.38 0.37 0.41
3 0.41 0.21 0.21 0.21 0.17 0.24
4 0.31 0.23 0.21 0.12 0.11 0.19
5 0.30 0.22 0.17 0.18 0.08 0.19
8 0.07 0.16 0.11 0.13 0.05 0.11
М 0.31 0.27 0.21 0.20 0.16

Примечание: П ункты в таблице представляю т собой средние величины де­


сяти наблюдений.

А ппарат состоял из доски, на которой был набор из т рядов, каж ды й из


которых содержал п гнезд, где тт&п принимали значение 2 ,3 ,4 , 5 или 8. Все
гнезда были пустыми кроме одного в каж дом ряду, в который помещ ался
билет. Количество отдельных стадий поэтому было от 2 до 8, с вероятностью
правильно угадать в каж дой стадии в пределах от 2Лдо 2'3.
И спытуемыми были 50 учащ ихся средней ш колы в возрасте 14-15 лет,
«интеллект» которых был, по крайней мере, столь ж е хорошим к ак у сред­
него взрослого. Испытуемому объяснили, что для того, чтобы вы играть приз,
он долж ен был угадать правильное местоположение билета в каж дом ряду,
и позволили делать только одно предположение на 1 ряд. Его задача состоя­
ла в том, чтобы приравнять то, что он считал вероятностью вы игры ш а при­
за, с одним из наборов лотереи.
Всего проводилось четы рнадцать лотерей. Десять из них имели 100 би­
летов каж дая, а вероятность вы тянуть выигрыш ный билет, основанный на
количестве выигрыш ных билетов в данной лотерее, бы ло0.01,0 .1 ,0 .2 ,0 .3 ...,
0.9. О ставш иеся четы ре лотереи имели 5 0 0 ,1 .0 0 0 ,5 . ОООи 10.000 билетов,
с соответствующим шансом вы тянуть счастливый билет 0.002,0.001,0.0002
и 0.0001.
Диапазон значений, принимаемых рядам и, и диапазон значений гнезд
учиты вал двадцать пять различны х ситуаций. К аж ды й из пятидесяти ис­
пы туемы х был приписан наугад одной из пяти ситуаций посредством слу­
чайны х латинских квадратов. Д есять испытуемых, таким образом, оцени­
вали тхп ситуаций каж ды й.
Оценка составных вероятностей... 407

Количество информации, которая фактически требовалась, чтобы определять


местонахождение цели - mlog.2n “бит”, где т - количество рядов, которые мы
теперь назовем “стадиями”, и п количество гнезд, которые будут определяться
как “альтернативы”. Вероятность вытянуть выигрышный билет в лотерее, выб­
ранной испытуемым, мы будем рассматривать как косвенную оценку его психо­
логической вероятности ip —получения приза.
Результаты , представленные в Таблице 1, показываю т что все значения
^ -я в л я ю тся оцененными слиш ком высоко, при оценке сложными вероят­
ностями, р, таким образом, подтверж дая наш прогноз. Величина переоцен­
ки обозначена отнош ениями гр к р в табл. 2, что предполагает, что реализм
оценок наруш ает очевидная тенденция меньш е принимать во внимание ко­
личество стадий, чем количество альтернатив в стадии, хотя дисперсион­
ный анализ показы вает, что относительно остаточной дисперсии, как дис­
персия между стадиям и, так и меж ду альтернативами - значимо различа­
ю тся (Р <0.01).
Таблица 2. Отношения ip/р психологической и сложной вероятности

Количест во альт ернат ив в Количест во ст адий в м ат рице


/•т л л ш / Г "
2 3 4 5 8
2 1,8 4,0 5,7 12,2 95,0
3 3,8 5,9 17,8 53,2 103
4 4,9 14,8 54,0 118,0 7*10*
5 7,5 27,8 106,0 563,0 ЗхЮ4
8 4,3 82,4 465,0 4хЮ3 9x10®

Этот отличительный эффект становится ясны м , если мы составим, как на


Рисунке 1, логарифм относительной переоценки, log 1Qip /p , против количе­
ства информации в битах, mlog2n, необходимые для определения местона­
хож дения цели. Отношение - линейное и задается уравнением:

log10ip / р = 0.26 mlog2n - 0.31 (1)

Оно мож ет быть переписано как:

Ц) j р = g (0 .8 6 rnlogen -0 .7 2 ) (2 )

из которого следует, что если мы оставляем количество стадий постоянным,


хр/р прямо пропорционально показателю степени количества альтернатив в
408 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
стадии, и , если мы оставляем количество альтернатив постоянным, гр / р
изм еняется по экспоненте с количеством стадий.
Если у нас есть т и п , мы можем предсказать среднее значение гр- пото­
му что

р=пт (3)

С лож ная вероятность р получена путем умнож ения соответствующей веро­


ятности правильного угады вания в каж дой из т стадий, и каж дая из этих
вероятностей, равна 1/п.
Поэтому, из (2) мы получаем, что

гр —е'0,72 п‘° 14т (4)


(е 0.72 = 0 4 9 )

В основном, поэтому относительная переоценка гр/р следует из объективно­


го ослабления мультипликативного ф актора т количества стадий. Его ос­
лабление имеет порядок шести седьмых от количества стадий, в пределах
наш их экспериментальны х ограничений. Это приводит к тому, что мы вы ­
водим то, что мультипликативны й элемент в сложной вероятности являет­
ся далеким от того, чтобы быть “простым” или интуитивны м, что может
помочь объяснить особые трудности, с которыми люди сталкиваю тся в изу­
чении статистики.

Рисунок 1. П ереоценка, относящ аяся к логарифму, против коли­


чества битов (log10 (гр /р ) против т log2 п ) .р - слож ная вероятность;
т - количество стадий; п - количество альтернатив
Оценка составных вероятностей... 409
Н аш а интерпретация поддерживается подобными экспериментами с испы ­
туемыми в возрасте 9+ и 10+ лет, у которы х, кроме относительной пере­
оценки у - никакие тенденции не являю тся заметными с вариациями в зна­
чениях т и п . Это такж е предполагает, что мультипликативны й элемент не
примитивен.
Метод, который мы использовали, вовлекает косвенную оценку хр. Бо­
лее п рям ая оценка м ож ет бы ть получена, если попросить испы туемого
вы брать между различны ми типами матриц. Полезность выбора, однако,
могла бы тогда стать важ ны м фактором.
Этот эксперимент объясняет очевидную тенденцию для принимающего
реш ения, в разнообразии ситуаций многоступенчатого выбора недооцени­
вать вероятность его успеха, и поэтому использовать несоответствующую
стратегию , о которой он будет позж е сожалеть.
С исторической точки зрения интерес представляет тот ф акт, что самые
искуш енные мыслители древней Греции, хотя они и очень интересовались
идеей возможного, особенно в стоической философии, никогда не применя­
ли комбинаторный анализ, который появился только в шестнадцатом сто­
летии. Сам А ристотель, очевидно, недооценивал п оняти я вероятности.
Лю бая интуиция испытуемого, которая бы ла у него и у других, бы ла нагру­
ж ена долгими приняты ми привы чками мы ш ления.
О тносительная переоценка составных сложны х вероятностей, которую
показал эксперимент, мож ет быть проявлением значительной общности в
принятии реш ений и выборе. Если так, это заслуж ивает специального обо­
значения. Мы предлагаем назвать это “инерционным хр - эффектом”.
25. Консерватизм в процессе обработки
информации человеком*

Вард Эдвардс

...Большое количество исследований показало, что люди являю тся консер­


вативны ми в обработке неверной информации. Такие эксперименты срав­
ниваю т человеческое поведение с результатами теоремы Байеса, формаль­
но оптимального правила о том, к ак мнения (то есть вероятности) должны
быть пересмотрены на основе новой информации. О казы вается, что измене­
ние мнения обычно упорядочено прямо пропорционально числам , получен­
ным из теоремы Байеса - но их недостаточно. Первое близкое приближение
к данным показало бы, что требуется где-то от двух до пяти наблюдений,
чтобы сделать одно наблюдение стоящ им работы для побуждения испытуе­
мого изменить свое мнение. М ножество экспериментов было нацелено на
объяснение этого явления. Они показы ваю т, что одна из главны х, а вероят­
но, и главная причина консерватизма - неверное накопление данны х у лю ­
дей. То есть люди точно чувствуют каж дую данную величину и хорошо зна­
ют о ее индивидуальном диагностическом значении, но неспособны хорошо
скомбинировать ее диагностическое значение с диагностическим значени­
ем других данны х при пересмотре м нений....
Вероятности определяют степень неопределенности. Вероятность, к ак со­
гласно Байесу, так и наш ей интуиции, составляет просто число между нулем
и тем, что представляет степень, для которой несколько идеализированный
человек считает, что утверждение верно. П ричина, по которой человек не­
сколько идеализирован, состоит в том, что сумма его вероятностей для двух
взаимно исклю чаю щ их событий должна равняться его вероятности того, что
произойдет любое из этих событий. Свойство аддитивности имеет такие по­
следствия, что мало реальных людей могут соответствовать им всем. Так как

* Выдержки из статьи, которая появилась в В. Kleinmuntz (Ed)., F o rm a l re p re se n ta tio n o f


H u m a n J u d g e m e n t. Нью-Йорк: John W iley and Sons, Inc, 1968. Переиздано в соответствии с
разрешением.
Консерватизм в процессе обработки... 411
такие вероятности описывают человека, который поддерживает мнение боль­
ш е, чем событие, о котором это мнение, их называют индивидуальными ве­
роятностями (см. Savage, 1954).
Теорема Байеса - это тривиальное последствие свойства аддитивности,
бесспорное и согласованное для всех сторонников вероятностей, к ак Байе­
са, так и других. Один их способов написать это следующий. Если Р (Нд | D) -
последую щ ая вероятность того, что гипотеза А была после того, к ак данная
величина D наблю далась, Р (Нд>) - его априорная вероятность до того, как
наблю далась данная величина D, Р (D | Нд) - вероятность того, что данная
величина D будет наблю даться, если верно НА, а Р (D) - безусловная вероят­
ность данной величины D, то

p (d I h ^ pcha)
Р (H a |D )=
( 1)
P(D )

P(D) лучш е всего рассматривать к ак нормализующ ую константу, заставля­


ющую апостериорные вероятности составить в целом единицу по исчерпы­
вающему набору взаимно исклю чаю щ их гипотез, которые рассматриваю т­
ся. Если ее необходимо подсчитать, она может быть такой:
P (D ) = Z P ( D | H /) P ( H i)
i
Но более часто Р (D) устраняется, а не подсчитывается. Удобный способ
устранять ее состоит в том, чтобы преобразовать теорему Байеса в форму
отнош ения вероятность-ш ансы. Рассмотрим другую гипотезу, Нв, взаимно
исключающую Нд, и изменим мнение о ней на основе той ж е самой данной
величины , которая изменила ваш е мнение о Нд. Теорема Байеса говорит,
что
Р(Нв, п ) = 1 < М в т в )
( 2)
P(D)

Теперь разделим Уравнение 1 на Уравнение 2; результат будет таким:


Р(НА \Р) _ Р ( Р \ Н А) шР(НА)
Р(НВ | Р) Р ( Р \ Н В) Р(Нв )
или

где Qj со став л яет апостери орны е ш ан сы в п ол ьзу Нд ч ерез HB,Q0апри­


орные ш ансы , a L - количество, знакомое статистикам к ак отношение веро­
ятности. У равнение 3 - это такая ж е соответствующ ая версия теоремы Б ай ­
еса как и Уравнение 1, и часто значительно более полезная особенно для эк ­
спериментов, с участием гипотез.
412 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
Сторонники Байеса утверждаю т, что теорема Байеса - формально опти­
мальное правило о том, как пересматривать мнения в свете новых данных.
Этот пересмотр мнения в свете данны х составляет именно тем, из чего со­
стоит статистический вывод, и поэтому он должен быть структурирован
вокруг теоремы Байеса - со многими последовательными отличиями от клас­
сической статистической практики. Д ля элементарной демонстрации этих
идей, н ап исанны х для психологов - эксперим ентаторов (см. E dw ards,
Lindm an и Savage, 1963). Но мы - не статистики, или, во всяком случае, ни
один из нас сегодня не носит «дурацкий колпак» статистика. Вместо этого,
к ак психологи, мы интересуемся сравнением идеального поведения, опре­
деленного теоремой Байеса, с ф актическим поведением людей.
Чтобы дать Вам некоторое представление о том, что это означает, давайте
попробуем провести эксперимент с Вами как с испытуемым. Эта сумка со­
держ ит 1. 000 покерных фиш ек. У м еня две такие сумки, причем в одной
700 красны х и 300 синих фиш ек, а в другой 300 красны х и 700 синих. Я
подбросил монету, чтобы определить, какую использовать. Таким образом,
если наш и м нения совпадают, ваш а вероятность в настоящ ее время, что вы ­
падет - сум ка, в которой больше красны х фиш ек - 0.5. Теперь, Вы наугад
составляете выборку с возвращ ением после каж дой ф иш ки. В 12 выборках,
Вы получаете 8 красны х и 4 синих. Теперь, н а основе всего, что Вы знаете,
какова вероятность того, что вы пала сум ка, где больше красны х? Ясно, что
она выш е, чем 0.5. П ож алуйста, не продолжайте читать, пока Вы не запи­
сали ваш у оценку.
Если Вы похож и на типичного испытуемого, ваш а оценка попала в диа­
пазон от 0.7 до 0.8 - хотя утверждение, которое часто делалось в предыду­
щ их параграф ах, что люди консервативны в обработке информации, воз­
мож но, сместило ваш ответ вверх. Если бы мы проделали соответствующее
вы числение, тем не менее, ответ был бы 0.97. Действительно очень редко
человек, которому предварительно не продемонстрировали влияние консер­
ватизм а, приходит к такой высокой оценке, даж е если он был относительно
знаком с теоремой Байеса.
Где-то в 1960 У ильям Л. Хейс, аспирант по имени Лоренс Д . Ф иллипс и я
заинтересовались обнаружением несоответствий между человеческим по­
ведением и поведением, указанны м теоремой Байеса. Простой пример пре­
дыдущ его параграф а не приходил нам на ум; вместо этого мы были уве­
рены , что мы долж ны будем использовать довольно сложную ситуацию ,
чтобы получить не Байесовское поведение. Так что, мы использовали гипо­
тетическую компью теризированную радарную систему. Бы ло 12 возмож­
ны х наблюдений, 4 возможные гипотезы и испытуемые должны были по­
нять и использовать демонстрацию 48 различны х значений Р (D|H). И спы­
туемые вы полняли задание при двух условиях. В одной, испытуемый ви­
дел единственный стимул, точку в секторе дисплея радара; затем он пере­
сматривал свои априорные вероятности по этим четырем гипотезам на ос­
нове данной величины , «урегулировав» четыре «рычага» к своим следую-
Консерватизм в процессе обработки... 413
хцим оценкам вероятности, затем повторно «устанавливал рычаги» в пози­
цию 0 в подготовке к следующему стимулу. Второй стимул состоял из ста­
рой точки плюс новой; испытуемый «устанавливает ры чаги», чтобы сооб­
щ ить о совокупном воздействии обеих точек. И так далее, пока не накопи­
лись 15 точек. Во втором условии, стимулы были перетасованы, и испытуе­
мы й, в действительности начинал заново с каж ды м новым стимулом. К удив­
лению экспериментаторов предсказание теоремы Байеса, что это различие
в условиях не должно произвести никакого различия для поведения, было
подтверждено. Кроме того, было еще одно условие, в котором каж дая новая
точка была показана одна, но испытуемым позволяли сохранять оценки от
одного стимула до следующего вместо того, чтобы повторно «регулировать
рычаги» к нулевой позиции после каж дой оценки. И опять, изменение в
условиях произвело мало различий в поведении.
П олож ительны х результатов эксперим ента Ф иллипса-Х эйза-Эвардса
было три. Во-первых, испытуемые были очень консервативны. Во-вторых,
они были наименее консервативны на первой точке, становясь более кон­
сервативными с увеличением их количества. Н аконец, суммы их оценок
вероятности, которые не были ограничены, вообще составили в целом боль­
ше чем 1, и увеличивались, по мере прохож дения испытуемых через после­
довательные стимулы в упорядоченной последовательности. Очевидно, для
испытуемых было легче определить, к ак ая гипотеза была одобрена стиму­
лом, и таким образом усилить вероятность этой гипотезы, чем реш ать, от
какой другой гипотезы долж на получаться вероятность для того, чтобы при­
дать ей легитимность.
Мы сильно медлили с публикацией этого первоначального эксперимен­
та по консерватизму. Х отя данные были полными уж е к 1962, книга Фил-
липса-Хэйза-Эвардса не выходила в печать до 1966 (Phillips и другие, 1966).
М асштаб и устойчивость проявления консерватизма поразили нас. К а­
залось уместным попробовать намного более простые задачи. Так, без боль­
шой веры , Ф иллипс и я пробовали предварительное испытание, подобное
по характеру примеру с сумкой и покерными ф иш ками, который Вы рас­
сматривали выше. К наш ему удивлению , это сработало очень хорошо. Боль­
ш ая часть текущ его исследования, сравниваю щ его человеческое поведение
с теоремой Байеса, может быть прослежено к этому предварительному ис­
пытанию и последующему эксперименту.
Если доля красны х ф иш ек в сумке - р, то вероятность получения г крас­
ны х фиш ек и (п - г) синих в п выборках с возвращ ением в некотором по­
рядке -р ' ( 1-р )пг. Так, в типичном эксперименте с сумкой и покерными фиш ­
кам и, если НАозначает, что доля красны х ф иш ек составляет рАи Н в - озна­
чает, что доля составляет рв, тогда отношение вероятности
L _ Р а <Х-Р аГ
(4)
- Р в )”
414 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
Обратите внимание, что, в то время к ак Уравнение 4 было получено из
рассмотрения ф актической последовательности красны х и синих в выбор­
ке, оно, возможно, одинаково могло быть получено из рассмотрения г крас­
ны х и ( л - г) синих в любом порядке; двучленный коэффициент, который
представляет число различны х способов, с помощью которы х можно полу­
чить г красны х в п испы таниях, появляется и в числителе, и в знаменателе,
и , таким образом, сокращ ает отнош ения вероятности. Это иллю страция
принципа вероятности статистики Байеса (см. Edw ards, Lindm an и Sevage,
1963), который в действительности говорит, при применении формулы Б ай ­
еса необходимо учиты вать только вероятность фактического наблю дения,
а, не вероятности других наблюдений, которые он, возможно, сделал бы, но
не сделал. Этот принцип имеет ш ирокое воздействие на все статистические
и нестатистические применения теоремы Байеса; это самый важ ны й техни­
ческий инструмент размы ш ления Байеса.
В особом случае, в котором рА= 1 - р в (симметрический двучленный слу­
чай), отнош ение вероятности сокращ ается до

2г-п

Обратите внимание, что 2 г - п = г - ( п - г ) - различие меж ду количеством


красны х и синих в выборке; только это различие, а не общее количество
наблю дений, составляет релевантным выводу в этом симметрическом слу­
чае. С татистическая традиция отмечает, что успехи различия (difference
successes) минус неудачи, или s - f; это обычная независимая переменная
экспериментов с сумкой и покерными фиш ками. Чтобы понимать объясне­
ние для обычных зависимых переменных, замените Уравнение 5 на У рав­
нение 3, возьмите логарифмы и перестройте термины. Результат

logL =(2r - n)log - = logQ 1 - log По


\~Ра
Если испытуемый действует по Байесу, отношение вероятности логариф­
ма, которое может быть выведено, вы читанием логарифма априорных ш ан­
сов из логарифма апостериорных шансов, должно быть пропорционально s - f ,
независимой переменной. Уместно начертить выведенное отношение лога­
рифма вероятности испытуемого, таким образом подсчитанное из его апос­
териорны х ш ансов (которые в свою очередь были рассчитаны из его апосте­
риорны х вероятностей, если он оценивал вероятности) и объективно соот­
ветствую щ ие априорные ш ансы , против s
Больш инство экспериментов с сумкой и ф иш ками в М ичиганской лабо­
ратории использовало генеральную совокупность из 48 пронумерованных
пультов, состоящ их из кнопки, красной и зеленой лампочек. Когда кнопка
Консерватизм в процессе обработки... 415
на пульте наж ата, одна из лампочек гаснет и снова загорается; испытуемым
говорят, что это эквивалентно выборке с возвращ ением ф иш ки соответству­
ющего цвета. Испытуемым говорят, что программа, которая управляет лам­
почкам и, бы ла написана, путем осущ ествления выборок из сумки. Ф акти­
чески, для больш инства экспериментов, программа скорее тщ ательно раз­
работана так, чтобы показанная последовательность бы ла репрезентативна
выборке из сумки, и в особенности так, чтобы в каж дом эксперименте вы ­
борки размера п одобряли несоответствующую гипотезу, часто используя
значение рА, для всех значений п.
Ф иллипс и я (1966) исследовали влияние рА, используя последовательно­
сти 20 ф иш ек и рАзначений 0.55, 0.7 и 0.85. Тестируемые оценили следую­
щ ие вероятности, распределяя 100 белых деревянны х дисков в два сосуда.
Типичные результаты таких экспериментов представлены на рис. 1 для 0.7
меш ков с различны ми априорными вероятностями. Три результата, про­
иллю стрированные на Рисунке 1, были обнаружены для всех испытуемых.
Во-первых, выведенные отнош ения логарифма вероятности были прибли­
зительно прямо пропорциональны s Во-вторых, априорные вероятности
использовались соответственно; то есть лучш ая подходящ ая линия для всех

Рис. 1. Оценки отдельного испытуемого для рА0.7 вы раж енны е во


внеш кальном логарифме вероятностных отношений к ак функции
различия между количеством успехов и количеством неудач в вы ­
борке
416 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
точек данны х проходит через изначальную . В-третьих, испытуемые были
консервативны ; лучш ая подходящ ая линия была, более ровной, чем линия,
представляю щ ая оптимальную формулу Байеса. Обнаружение почти линей­
ности выведенных коэффициентов логарифма вероятности для s - f (или, что
эквивалентно, с коэффициентами логарифма вероятности Байеса) предла­
гает еще одну зависимую переменную: отношение наклона лучш е всего со­
ответствующей линии для всех оценок испытуемых к наклону линии Байе­
са. Петерсон, Ш найдер и М иллер (P eterson, Schneider и M iller, 1965) назва­
ли это отношение отношением точности; они такж е обнаружили, что оно
более или менее постоянно для s - f .
Рисунок 2 показы вает соотнош ения точности данных Ф иллипса-Эвард-
са для трех значений рА. Д ля наименее диагностической информации, ис­
пытуемые показали более экстремумные результаты , чем теорема Байеса.
(Dale обнаруж ил то ж е самое; см. W . Edw ards, 1965.) Но для информации,
имеющ ей разумно высокое диагностическое значение, испытуемые были
консервативны , и соотношение точности было очень постоянным для s-f.
Обратите внимание, что с увеличением диагностичности, консерватизм так­
ж е увеличивается. Это стандартный вывод в таких экспериментах; любая
процедура, которая увеличивает диагностичность индивидуального наблю­
дения (одной ф иш ки или нескольких) такж е увеличивает консерватизм.
(См. например P eterson, Schneider и M iller, 1965.)

-2 0 2 4 6 В 10 12 14 16 18

s —f

Рис. 2. Отношение точности для трех значений рАдля различны х


составов выборок
Консерватизм в процессе обработки... 417
Ф иллипс и я , после получения этих результатов, приш ли к выводу, что
одна причина для консерватизма могла бы состоять в том, что испытуемые,
зная, что ш кала вероятности ограничена и, зам ечая, что доказательство
могло продолжать подниматься, заниж али свои оценки. Очевидное сред­
ство, в таком случае, должно использовать неограниченный способ ответов,
таких к ак ш ансы. Так что мы провели исследование с четы рьмя группами.
Контрольная группа оценила вероятности, распределяя 100 дисков в два
сосуда, к ак прежде. Группа, оцениваю щ ая ш ансы вербально, просто сдела­
ла устные оценки шансов; мы всегда принимаем ш ансы, к ак числа, равня­
ю щ иеся единице или больше, и поэтому всегда сопровождаем утверж дения
ш ансов утверж дениям и, гипотезы которы х поддерж иваю тся ш ансами.
Группа, оцениваю щ ая ш ансы с помощью логарифмических ш кал, сделала
оценки, перемещ ая указатель по ш кале ш ансов, которая содержала четыре
ц икла логарифма, так, что могли быть, оценены ш ансы от 1:1 до 10.000:1.
Ч етвертая группа такж е использовала ш ансы на логарифмической ш кале,
но числа, введенные напротив маркировки ш калы , были скорее вероятнос­
тям и, чем ш ансами (таким образом, 0.5, а не 1:1, 0.67, а не 2:1, 0.80, а не
4:1, и т.д.). Это назвали вероятностью на группе логарифмической ш калы
ш ансов. Бы ло обнаружено, что все группы были весьма консервативны.
Вероятностная группа бы ла самой консервативной, группа на логарифми­
ческой ш кале шансов была еще хуж е, а две группы ш ансов были приблизи­
тельно сопоставимы, а ш ансы на логарифмическом масштабе были немно­
го большими.
Это открытие просто подчеркивает ф акт, который стал все более и более
ясным в ходе наш ей работы Байеса. Вероятность - довольно плохое измере­
ние неопределенности, кроме к ак в ситуациях, в которых перераспределе­
ние или другое прямое использование свойства аддитивности являю тся не­
обходимыми. Что лучш е ш ансы или логарифм шансов? Ш ансы наиболее
интуитивно понятны для неопытных испытуемых, и могут наиболее легко
быть связанны ми с простыми действиями (например, выбор среди ставок);
тот ф акт, что сфера азартны х игр структурирует свои утверж дения и имеет
дело с ш ансами, а не с вероятностями, является и признанием, и возможно
причиной большей интуитивной значимости ш ансов. Логарифм ш ансов,
уникальны й среди более или менее общей метрики неопределенности, име­
ет такое свойство, которое в этом метрическом свидетельстве является ад­
дитивным. Если мнение измерено с помощью логарифма шансов, количе­
ство изменений во мнении, произведенных частью свидетельства, незави­
симо от того, с чего мнение должно было начинаться. Это изящ ное свойство
делает логарифм шансов уникально удобными для экспериментов Байеса.
Данные Ф иллипса-Эвардса могут быть пригодны за счет простой моди­
ф икации теоремы Байеса:

Qj=Lc • Q0
418 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
Константа С, степень, в которую каж дое отношение вероятности возводит­
ся до обработки ее посредством теоремы Байеса, составляет отношением точ­
ности. К сож алению , она зависит от важ ны х независимы х переменны х,
вклю чая диагностичность данных и ответную метрику. Однако, то, что та­
к а я простая н аглядная модель так хорошо вписы вается, можно объяснить
в соответствии с любой теорией консерватизм а....
... Вероятностная система обработки информации, или ВСОИ ( или с англ.
PIP)... - это идея о том, как проектировать человеко-маш инные системы,
которые долж ны обрабатывать информацию для достиж ения заклю чения
о том, в каком состоянии находится мир. Примеры ситуаций, в которые та­
к а я обработка информации долж на быть сделана, вклю чаю т медицинский
диагноз, военное командование (в котором командую щ ий, возможно, дол­
ж ен определить, действительно ли он находится под угрозой нападения, и
если так, каков план его противника), и управление бизнесом (например, в
случае бизнесмена, решающего, необходимо ли производить новое изделие).
И дея относительно ВСОИ слиш ком слож ная, чтобы объяснять ее подробно
здесь (см. Edw ards, Lindm an и P hillips 1965, или W . Edw ards, 1966). Сущ­
ность ВСОИ в том, что задача диагностической обработки информации мо­
ж ет быть разделена на два класса подзадач. Один класс подзадач состоит из
оценки диагностического воздействия индивидуальной данной величины
на отдельную гипотезу или пару гипотез. Д ля вербальных, качественных
видов данны х и для гипотез, которые характеризую т многие реальные ди­
агностические установки, это, каж ется, задача, которая обязательно долж ­
на вы полняться человеком с большим опытом. Но второй класс подзадач -
это соединение этих отдельных диагностических воздействий для всех дан­
ны х и гипотез в картину того, к ак все гипотезы в настоящ ее время пред­
ставлены в свете всех доступных данных. Эта задача соединения может быть
легко механизирована посредством теоремы Байеса, если диагностические
воздействия индивидуальных данных оценены в форме значений Р (D\H)
или отнош ения вероятности. (В большинстве ситуаций, хотя не во всех, оцен­
ки отнош ений вероятности явно предпочтительны, по формальным причи­
нам , для оценки Р (D\H).)
Мне и приблизительно пятнадцати сотрудникам было интересно, рабо­
тает ВСОИ или н е т . Мы разработали придуманный, но сложный мир 1975.
В этом мире мы перечислили ш есть гипотез, которые тестируемые должны
были рассмотреть, определяющ ие три источника данны х (Система дальне­
го обнаруж ения баллистических ракет, система спутникового зондирова­
н ия и система разведки), которые обеспечивали данные, опираю щ иеся на
эти гипотезы , и разработали четыре системы для обработки данны х. Эти
четы ре системы назы вали P IP , POP, PEP и PU P. В P IP , тестируемые оцени­
вали п ять отношений вероятности для данной переменной. Одна из этих ш е­
сти гипотез была “Будет продолж аться мир”, а другие пять были вероятно­
стью различны х войн; пять конъю нкций войны с миром определяли пять
отнош ений вероятности, которые будут оценены. Другие три системы обра­
Консерватизм в процессе обработки... 419
ботки информации, которые Есе подразумевали, что испытуемый оценивал
апостериорные ш ансы или вероятности или подобные апостериорные вели­
чины ; таким образом, в P IP компьютер соединил данные посредством тео­
ремы Байеса, в то время к ак во всех трех других сис темах испытуемые дол-
ясны были объединить данные в уме. Чтобы помочь им это сделать, тестиру­
емые в POP, PEP и PU P производили оценивание, после того, к ак им стано­
вилась доступна n -ная данная величина, когда они рассматривали (п+1)
данную величину, так что им приходилось только модифицировать оцен­
к и , на которые повлияли данные величины.

1:1000 1:500 1:100 1:5 1:2 1:1 2:1 5:1 10:1

Финальные шансы для PIP (по логарифмической шкале)

Рис. 3. Ф инальные ш ансы в пользу войны для POP в сравнении с


PIP по логарифмической ш кале

Было всего 18 сценариев с 60 условиями данных в каждом сценарии. Все


условия кроме информации о системе дальнего обнаружения баллистических
ракет были представлены в форме коротких абзацев. 34 испытуемых были обу­
чены характеристикам мира, гипотезам, этим трем источникам данных и сис­
теме обработки информации, которую каж ды й должен был использовать.
Так к ак P IP была явно лучш ей, a POP была следующей, я представлю
только сравнение между ними. (PU P была третьей, а РЕР, самый близкий
результат, к тому способу, которым обработка информации происходит сей­
час, бы ла худш ей.) Рис.З показы вает заклю чительные ш ансы, после 60-го
условия данны х в каж дом сценарии, в пользу каж дой войны по сравнению
с миром для P IP и для POP. Две самые важ ны е вещ и, которые нужно заме -
420 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
тить на граф ике - это то, что эти две группы очень хорошо согласуются к а­
чественно (корреляция между ними - 0.895), но они не согласуются коли­
чественно. P IP намного более подвержена влиянию данны х, чем POP; тот
ж е самый сценарий, который приведет PIP к тому, что он будет очень уве­
ренным относительно мира или войны, приведет POP, к намного меньшей
уверенности. Иными словами, P IP - менее консервативна, чем POP, воз­
можно , потому что в POP, субъекты должны объединить данные, в то время
к ак в P IP , испытуемые оцениваю т диагностическое воздействие каж дой
данной величины отдельно, и теорема Байеса делает их соединение.
Вы долж ны такж е обратить внимание, что обе оси на рис. 3 логарифми­
чески разделены . Если Вы переводите различие в эффективности обратно в
ш ансы , различие между P IP и POP становится очевидным. Н апример, вы ­
числение, исходя из линии регресса, привел ли сценарий P IP к тому, чтобы
дать 99:1 ш ансы в пользу войны над миром, POP дал бы только 4:1 (шансы)
в пользу этой войны , а не мира.

------- начальная последовательность


-------конечная последовательность
• действительные шансы
▲ ELR, - шансы
■ ELRj - шансы
х оцененные шансы

Количество испытаний

Рис. 4. М едианные апостериорные ш ансы для всех испытуемых в


пользу начального множ ества к ак ф ункции количества испытаний
Консерватизм в процессе обработки... 421
Гипотеза неправильного восприятия не может объяснить это несоответствие
между P IP и POP, в P IP испытуемые оцениваю т диагностическое воздей­
ствие каж дой данной величины отдельно; в POP испытуемые должны объе­
динить в уме - и сделать это весьма консервативно. Так к ак никакая мо­
дель процесса порождающего данные не доступна, невозможно сказать к а­
ковы правильные апостериорные шансы. Но различие между PIP и POP явно
вызвано различием в процессе агрегации.
Лэрри Ф иллипс, один из сотрудников в этом эксперименте, был заинтере­
сован тем, что никакая модель процесса порождающего данные не была дос­
тупна и, так что нельзя было сказать с уверенностью, был ли PIP или POP
более правилен. Так в своей докторской диссертации он сравнил P IP с POP в
ситуации, в которой модель процесса порождающего данные была доступна,
имело смысл спросить сотношение вероятности для отдельной данной вели­
чины , и процедура POP произвела консервативные оценки. Его испытуемые
были редакторами студенческой газеты М ичиганского Университета. Он взял
статьи каждого редактора в течение семестра, посчитал две первые и после­
дние буквы в каждом слове каж дой статьи, и таким образом, для каждого
редактора подготовил множество начальных биграмм и множество конечных
биграмм. Д ля задачи PIP , он взял определенные биграммы, и попросил ре­
дактора оценить (только для его собственного множества) отношение вероят­
ности, взятое с гипотезой множества начальных биграмм в числителе и ги­
потезой множ ества конечных биграмм в знаменателе, связанное с каж дой
биграммой. Д ля задачи POP, он подготовил последовательность биграмм, выб­
ранных из одного из множеств, и спросил редактора, когда он прорабатывал
последовательность, оценить апостериорные шансы, что это было начальное,
а не конечное множество. Много усилий было потрачено на предварительное
обучение редакторов, и оценки отношения вероятности были собраны дваж ­
ды, один раз до и один раз после апостериорных оценок шансов.
В анализе данны х возникла проблема, потому что все оценки, и для PIP,
и для POP, были смещены в пользу начального множества. Это вероятно,
потому что намного легче, например, думать о словах, которые начинаю тся
на ге, чем о словах, которые заканчиваю тся на ге, даж е при том, что ге ско­
рее встречается к ак окончание, чем к а к начало слова; мы приучены к м ар­
кировке слов по их началам, а не окончаниям, когда мы, например, ищем
их в словаре. Однако, возможно исправить такие предубеждения. Рисунок
4 показы вает результаты после такого исправления. Действительные ш ан­
сы, подсчитанные из фактического счета биграмм, являю тся наиболее эк-
стремумными. Затем идут ш ансы , подсчитанные из второго набора оценок
отнош ения вероятности. Затем идут ш ансы , подсчитанные из первого набо­
ра оценок отнош ения вероятности. И, наиболее близкими к середине и по­
этому наиболее консервативными, являю тся непосредственно оцененные
апостериорные ш ансы. Если мы верим этим данным (а я верю), хотя PIP
значительно менее консервативен, чем POP, он все-таки слиш ком консер­
вативен, но оценки P IP улучш аю тся с практикой.
26. Гипотеза угадывания в многоступенчатом
выводе*

Чарльз Ф.Джеттис, Клинтон Келли III и


Камерон Р. Петерсон

М ногоступенчатый вывод состоит из ряда одноступенчатых выводов, где


результат каж дой предыдущ ей стадии становится входными данными к
следующ ей стадии. В выводах с единственной стадией рассуждаю т, исходя
из данны х или однозначно наблюдаемого свидетельства к набору гипотез.
М ногоступенчатый вывод начинается с тех ж е самых однозначных данных
или свидетельства в первой стадии; однако, входные данные для следую­
щ ей стадии - это результат предыдущ ей стадии. Следующая стадия вывода
поэтому базируется на вероятностях событий, а не на определенном знании,
что некоторы й случай является верным (G ettys и W ilike, 1969).
Например, предположим, что Вы хотели предсказать успех или неудачу
большой вечеринки в саду. Предположим, что вечеринка, менее вероятно,
будет успешной, если собравшиеся будут толпиться в закрытом помещении
из-за дождя. Ваш а переменная - присутствие темного облака на горизонте.
П ервая стадия вывода связала бы темное облако с наличием или отсутствием
дож дя в течение вечеринки. Предположим, что Вы оценили, что вероятность
дож дя была 0.70. Эта оценка стала бы входными данными к следующей ста­
дии вывода. Если бы Вы знали с уверенностью, что будет дождь, то Вы могли
бы вывести вероятность того, что вечеринка будет иметь успех. Но Вы полно­
стью не уверены, что будет дождь; данные, которые Вы имеете, указываю т на
дождь с вероятностью 0.70, так что, что вам теперь делать?
М одифицированная теорема Байеса (МТБ) обеспечивает оптимальную мо­
дель для таких многоступенчатых выводов (Dodson, 1961; G ettys и W ilike,
1969). М ножество исследований показало, что интуитивная работа в много­
ступенчатой задаче заканчивается большей определенностью, извлекаемой
из данны х, чем предсказано моделью МТБ. Н апример, в задаче оценки ш ан­

* Эта глава первоначально появилась в Organizational Behavior and Human Performance,


1973, 10, 364-373. Авторское право © 1973 Academic Press, Inc. Переиздано в соответствии
с разрешением.
Гипотеза угадывания в многоступенчатом выводе 423
сов ш ансы испытуемых типично больше, чем рассчитанные МТБ. Этот ре­
зультат весьма удивителен, потому что свидетельство указы вает, что пове­
дение людей в задаче вывода единственной стадии почти всегда консерва­
тивно; то есть, люди извлекаю т меньше определенности, чем гарантируют
данные (например, W . Edw ards, 1966). Парадокс, конечно, в том, что много­
ступенчатый вывод является совокупностью выводов. Если люди извлека­
ют меньш е определенности, чем гарантирую т данные в одноступенчатых
выводах, то в многоступенчатой ситуации можно было ожидать, что они ста­
нут все более консервативными с каж дой последующей стадией, так к ак их
отклонения от не оптимальности долж ны накапливаться от стадии к ста­
дии. Ф актически это изменение верно; они более уверены в конце двух ста­
дий вывода, чем гарантировано оптимальной моделью МТБ. Из этого следу­
ет, что некоторый процесс происходит в “интерфейсе” одноступенчатого вы ­
вода, который является настолько экстремумным, что любой консерватизм
побежден.
Задача вывода единственной стадии всегда базируется на данных, кото­
рые известны. Однако, даж е при том, что многоступенчатая задача начина­
ется с определенных данных, апостериорные стадии вывода имеют дело с
неопределенными данными. Н есколько моделей были сформулированы для
объяснения, к ак необходимость иметь дело с вероятностями данны х, а не с
определенными данными могла бы создать чрезмерную определенность в
многоступенчатом выводе. Одна неопт:ш альная модель, имею щ ая свойство
предсказания чрезмерной определенности - модель “К ак будто” (G ettys и
W illke, 1969; Howell, G ettys, и M artin, 1971). Этамодель, разработанная для
ситуаций, в которых люди имеют выбор, чтобы собрать больше данных, если
они чувствую т, что они нуж ны , предполагает, что сбор данны х продолжа­
ется в первой стадии вывода, пока человек принимаю щ ий реш ения не дос­
таточно уверен в состоянии мира. К ак только его уверенность превыш ает
некоторое пороговое значение, он переходит к следующей стадии вывода,
действуя “к ак будто” он полностью уверен относительно данных следую­
щ ей стадии. Чтобы возвратиться к примеру вечеринки в саду, принимаю ­
щ ий реш ение, увидев темное облако, мог бы получить текущ ее сообщение
прогноза погоды. Предположим, в прогнозе погоды был предсказан серьез­
ный ш торм. Уверенность в вероятности дож дя теперь превысила бы его по­
роговое значение, и он переходит ко второй стадии вывода, “к ак будто” он
уверен в том, что будет дождь. Результат второй стадии вывода был бы его
оценкой вероятности успеха или неудачи, основанной на его "как будто"
предположении о дожде. Его оцененная вероятность для неудачи должна
теперь превысить фактическую вероятность ( МТБ) неудачи, потому
что, делая "как будто" предположение о дожде, он игнорирует вероят­
ность, что этого дождя может не быть. Если, ф актически, его, "как буд­
то" предположение неправильно, и дождь не идет, то вечеринка, вероятно,
будет иметь успех. О птимальная модель рассматривает обе возможности,
дождь и отсутствие дож дя, в приписывании вероятности к успеху или не­
424 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
удаче. М одель "как будто" рассматривает только возможность дождя» и по
этой причине ведет к чрезмерной уверенности, что вечеринка не удастся.
К ак человек мог бы вести себя, если бы его уверенность о входных дан­
ны х ко второй стадии вывода бы ла меньш е, чем пороговое значение, требу­
емое для "как будто" предположения, и не было никакой надежды относи­
тельно увеличения его уверенности с получением дополнительных данных?
Одна возм ож ная гипотеза, которая является совместимой с возрастающ ей
уверенностью, обнаруженной в предыдущ их исследованиях - то, что он бу­
дет сначала делать предположение "как будто", которое является в лучш ем
случае угады ванием. Эта модель, названная “У гады вания” действует как
усоверш енствованная "как будто" модель и разделяет с ней идею того, что
принимаю щ ий реш ения будет либо игнорировать, либо иметь тенденцию
игнорировать значения других менее вероятных событий во второй стадии
вывода, концентрируясь почти исклю чительно на наиболее вероятном со­
бытии. Д ля примера, если единственная информация, которую Вы имеете
- темное облако н а горизонте, Вы не захотите сделать дисквалифицирован­
ное "как будто" предположение, но Вы могли бы сначала предположить,
что будет дождь и достигнуть субъективных шансов для успеха, основанно­
го на этом предположении. Тогда, так к ак Вы не полностью уверены, что
будет дож дь, Вы могли бы несколько уменьш ить ваш и субъективные ш ан­
сы, чтобы принять это во внимание. Эти субъективные ш ансы могли бы от­
личаться от рассчитанных с помощью МТБ, прежде всего потому,что Вы
явно не рассмотрели вероятность того, что не будет никакого дож дя.
Сэппер и Ф райбек (Snapper & Fryback, 1971) представили результаты ,
которы е являю тся совместимыми с выш еупомянутым объяснением в экс­
перименте, касаю щ емся надежности данны х. Однако, их процедура не по­
зволяла проводить прямое испытание модели "У гады вания"; что является
целью следующего эксперимента.

М етод
Ц ель эксперимента требовала, по крайней мере, трех уровней переменных,
построенных таким образом, что промежуточный уровень переменной со­
держ ит более двух событий. Далее требуется управление распределением
вероятности для всех событий, кроме наиболее вероятного из промежуточ­
ны х - управление, которое будет иметь результирующ ее воздействие на ве­
личину пересмотра оптимальной вероятности на верхнем уровне как резуль­
тат возникновения события на более низком уровне.
Следовательно, три уровня приняли следующую форму. Переменная верх­
него уровня состояла из двух меш очков, помеченных I и II, соответственно.
К аж ды й меш очек был заполнен маленькими контейнерами, которые пред­
ставляли собой события промежуточного уровня. К примеру, каж ды й ме­
ш очек содерж ал 18 м аленьких коробочек (коробочки от 35-милиметровой
пленки) и каж дая из них была помечена А, В, С или D. Н аконец, в каж дой
Гипотеза угадывания в многоступенчатом выводе 425
коробочке было 100 маленьких цветны х картонны х круж очков; каж ды й
из которы х был одного из четы рех цветов: красны й, ж елты й, зелены й, си­
ний.
Состав каж дого контейнера описан в Таблице 1. Часть А таблицы описы­
вает состав меш очка относительно коробочек, и Часть В - относительно кру­
ж очков. Н апример, 8 коробочек, помеченных А , находятся в меш очке I,
тогда к ак только I коробочка, помеченная А, находится в меш очке II. К ак
показано в части В, 80 круж очков находятся в коробочке А, 1 - в коробочке
В, 1 - в коробочке С и 18 - в коробочке D.

Таблица 1. Числовой состав мешочков и коробочек из-под пленки

А . Состав меш очка


Б ук ва на коробочке из-
под пленки М еш очек 1 М еш очек 2
А 8 1
В 3 6
С 6 3
D 1 8
В. Состав коробочки из-под пленки

круж очка К°Р°6очка А Коробочка В Коробочка С Коробочка D


1$>асный 80 1 1 18
Зеленый 1 80 18 1
Желтый 18 1 80 1
Синий 1 18 1 80

Эксперимент проходил следующим образом. Выбирались наугад: один из


двух меш очков, одна коробочка из этого меш очка, один круж очек из этой
коробочки. Таким образом, выбор красного круж очка обеспечивает доказа­
тельство в пользу коробочки А, что в свою очередь обеспечивает доказатель­
ство в пользу меш очка 1. Заметьте, что, это только событие первого уровня,
круж очек, которы й наблюдается непосредственно. Это наблюдение обеспе­
чивает только частичное доказательство с учетом события промежуточного
уровня, коробочка, которая, в свою очередь, обеспечивают частичное дока­
зательство, о том, какое событие верхнего уровня было выбрано. Таким об­
разом, первая стадия вывода имеет отношение к цвету круж очка, к букве
на коробочке, а вторая стадия вывода имеет отношение, к букве на коробоч­
ке и номеру меш очка.
С тратегия действия, к ак будто наиболее вероятное событие верно на од­
ном уровне, приведет к распределениям вероятности, которые являю тся
экстремумными на следующем более высоком уровне. Таким образом, эта
426 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
стратегия совместима с эмпирическим результатом, согласно которому люди
чрезмерно пересматриваю т вероятности верхнего уровня в многоступенча­
той задаче.
Существует другая тестируемая гипотеза, которая может быть получена
из стратегии "У гады вания". Если человек действует, к ак будто наиболее
вероятное событие верно на любом промежуточном уровне, тогда он игно­
рирует распределение вероятности для всех других событий на этом уров­
не. Его пересмотр вероятности на верхнем уровне должно быть поэтому не­
чувствителен к изменениям в распределении вероятностей для всех собы­
тий, кроме наиболее вероятного на промежуточном уровне. Данный экспе­
римент был предназначен для проверки этой гипотезы.

П л а н эксперимент а
Бы ли разработаны три задачи по типу представленных в Таблице 1. Часто­
ты , показанны е в части А, использовались во всех трех задачах. М атрица,
показанная в части В, использовалась в одной задаче; в других двух задачах
значение 80 в более низкой матрице было изменено или на 70, или 90, а зна­
чение 18 было изменено или на 28, или на 8, соответственно. Д ля последую­
щ его обсуждения эти три задачи будут определяться к ак задачи 70-28, 80-
18,90-8. Во всех трех задачах испытуемые оценили ш ансы меш очков, учи­
ты вая цвет одного круж очка, взятого из коробочки.

Рисунок 1. Модели “угады вания”, “к ак будто” и МТБ к ак показа­


тели поведения “незнаю щ их” испытуемых
Гипотеза угадывания в многоступенчатом выводе 427
И спы т уем ы е
25 испы туемы х были студентами М ичиганского университета, которые ра­
нее принимали участие в эксперименте с многоступенчатым выводом, про­
должительностью около двух часов. В предыдущем эксперименте испытуе­
мые были обучены необходимому способу ответа и произвели ряд оценок
ш ансов в задаче с многоступенчатым выводом. Однако никогда не обсужда­
лась оптимальная модель, и никогда не использовалась обратная связь.

И н ст р укц и и испытуемым
И нструкции были кратким и из-за предыдущего эксперимента. Испытуе­
мым объяснили детали задачи. Их попросили представить, что мешочек был
выбран наугад на основании подбрасывания монеты, что коробочка была
наугад вы брана из меш очка, и что картонны й круж очек был наугад выбран
из коробочки. И х попросили предположить, что круж очек определенного
цвета был выбран таким образом и оценить ш ансы мешочков на основании
цвета этого круж очка.

Процедура
П олучив инструкции, испытуемые оценили ш ансы мешочков в трех зада­
чах. М атрицы, подобные указанны м в Таблице 1, использовались, чтобы
показать испытуемым относительные частоты коробочек и круж очков. За­
дачи были представлены в случайном порядке для каж дой группы, состоя­
щ ей от 4 до б человек. В каж дой задаче четыре возможных цвета использо­
вались в случайном порядке. Испытуемые оценивали ш ансы меш очков для
всех возмож ны х цветов перед тем, к а к приступить к следующей задаче.
После 12 оценок (4 цвета в задаче х З задачи) три задачи были повторены,
используя другие случайные порядки для всех 24 оценок, по две для к аж ­
дого цвета в каж дой задаче.

Р е з у л ь т а т ы и об суж д ен и е
Обзор данны х показал чрезвычайную бимодальность в оценках шансов. Д ля
некоторы х испытуемых теоретическое различие между синими и красны ­
ми круж очкам и и между зелеными и ж елты ми круж очками не вы зывало
различия в оценках шансов. Другие испытуемые были более крайними в
оценках ш ансов с синим круж очком, неж ели с красны м и более крайним и с
ж елты м круж очком , неж ели с зеленым. Последние соответствовали МТБ,
по крайней мере, в порядковом смысле. О казалось, что некоторые испытуе­
мые "не знали" о разнице синий-красны й и ж елты й-зелены й, в то время,
к ак другие испытуемые "знали" в той степени, что они отвечали, по край ­
ней мере, в правильном отнош ении. П ринимая это во внимание, все испы ­
428 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
туемые, которы е отвечали, по крайней мере, с одной оценкой шансов для
синего, которая была на 2 % больше, чем зеленого или оценка для желтого, на
2% выш е, чем зеленого, были названы "знаю щ ими". Эти испытуемые были,
по крайней мере, минимально "знаю щ ими", т.к . для одного или нескольких
оцениваний их оценки шансов изменялись в паре синий-красный и паре ж ел­
тый-зеленый в направлении, которое определяла МТБ. 10 из 25 испытуемых
были названы "знающ ими" с помощью этого консервативного критерия.
Остальные 15 "незнаю щ их" испытуемых, были не склонны отвечать по-
разному на изменение в вероятностях менее вероятных событий. Они бук­
вально игнорировали выводы менее вероятных коробок. И х ответы соответ­
ствуют крайней форме модели "угады вания". М едианы ответов "незнаю ­
щ их" испытуемых показаны на рис.1. П оскольку меш очек, по которому
ш ансы предпочтительны иррелевантны , данные нанесены на ш калу абсо­
лютного логариф ма ш ансов. Средние ответы логарифма шансов на красны е
и синие круж очки соединены сплош ной линией в верхней части рисунка
для трех уровней неопределенности данны х, медианы для ж елты х и зеле­
ны х круж очков такж е помечены в ниж ней части рисунка. Н а рис. 1 такж е
обозначены прогнозы для МТБ (линия на диагонали), предсказания для мо­
дели "к ак будто" (две горизонтальные линии) и предсказания для версии
модели угады вания, обозначенной на рисунке к ак модель I.
П редсказания модели I получены путем умнож ения вероятности наибо­
лее вероятного события на апостериорные ш ансы, полученные, если собы­
тие было верным. Предположим, в задаче 80-18 был выбран красны й кру­
ж очек. Вероятность коробочки А - 0.80, ш ансы 8:1, если действительно
круж очек вы нимался из А. П редсказания модели I будут 0 .8 8 /1 = 6 .4 или
ш ансы 6.4:1. Модель "как будто" прогнозирует шансы 8:1 для синих и крас­
ны х круж очков и 6:3 для ж елты х и зелены х, при условии, что пороговая
уверенность в типе коробочки преодолена. Д ля МТБ оптимальные ш ансы
для красного круж очка - 2.86:1 и могут быть вычислены в соответствии со
следующ ей формулой для апостериорных шансов (изменено из формулы 5
в G ettys & W illke, 1969):

n, _ 7 . ч _7Ч %Р(цвет | коробкаi)Р(коробка j | )


Р\С1 \цвет) _ Р\С1) г
Р(СП \цвет) Р(СН) ^Р(цвет \коробка{)Р(коробка^М11)

где М - меш очек, и другие данные посчитаны из условных вероятностей,


к а к показано в Таблице 1.
Д анны е на Рисунке 1 не подходят ни к прогнозам "как будто", ни к МТБ.
Ответы испы туемы х менее крайние, чем прогнозы "как будто" для верхних
пар синий-красны й, где прогноз "как будто" - 8:1 ш ансов, и такж е менее
крайний, чем прогноз 6:3 ш ансов в ниж ней части рисунка. Однако крайние
версии модели угады вания и модели I, соответствуют медианам Рисунок 1.
Гипотеза угадывания в многоступенчатом выводе 429
Горизонтальные пунктирны е линии на Рисунке 1 - прогнозы модели I. Д ля
всех задач прогнозы модели I расположены правее диагонали МТБ для ж ел­
ты х круж очков в ниж ней части Рисунка 1. Модель "как будто" и модель I
не обязательно прогнозирую т оценки ш ансов, которы е являю тся более
крайним и, чем шансы МТБ. Эти вопросы поднимаются, например, в задаче
80-8, когда коробочка С является наиболее вероятной (Р = 0.80), а коробочка
А (Р=0.18) наименее вероятной. Наиболее вероятное событие дает шансы
6:3 для меш очка I, если оно верно и наименее вероятное событие дает ш ан­
сы 8:1 для меш очка I. В этом случае, лю бая модель, которая игнорирует
отношение 8:1, данное менее вероятным событием, будет консервативной
по отношению к МТБ.
Если допустить это, испытуемые не приняли бы неоптимальную модель,
если она бы ла получена из субъективного чувства уверенности, и , возмож­
но, важ ны й результат - то, что они использовали модель I , потому что ду­
м али, что она правильная. Бы ла определена величина оценки шансов моде­
лью I, но в другой ситуации они могли использовать другое правило комби­
нации. Тот ф акт, что прогнозы модели I действительно соответствуют дан­
ны м, предполагает, что испытуемые склонны сосредотачиваться на наибо­
лее вероятной альтернативе и игнорировать выводы менее вероятной аль­
тернативы .
Данные для 10 "знаю щ их" испытуемых представлены на Рисунок 2. К ак
и на Рисунок 1, прогнозы модели "как будто" и модели МТБ показаны на
рисунке, но прогнозы Модели I опущ ены, потому что они явно не соответ­
ствуют данным.

Шансы абсолютного
логарифма МТБ

Рис. 2. Результаты “знаю щ их” испытуемых в сравнении с прогно­


зами моделей МТБ и модели “к ак будто”
В общ ем, "знаю щ ие" испытуемые отвечали на те ж е переменные, что и
М ТБ, но количественное соответствие модели МТБ скромное. К ак и МТБ,
испытуемые менее уверены, чем подразумевалось моделью "как будто" для
синих и красны х круж очков. Такж е, к ак и в М ТБ, их оценки желтому кру­
ж очку превосходят прогнозы "как будто". Это происходит, потому что наи­
более вероятное событие имеет ш ансы 6:3 и менее вероятное событие имеет
ш ансы 8:1. Если испытуемые осознают нюансы многоступенчатых ситуа­
ц и й , они долж ны понимать, что ш ансы долж ны бы ть больш е, чем 6:3.
Единственное исключение к этой общей картине - это расположение данных
80-18 для ж елты х и зеленых круж очков. Апостериорные ш ансы, основан­
ные на ж елтом цвете, должны увеличиться в то время, к ак вероятность наи­
более вероятного события уменьш ается, а ш ансы , основанные на зеленом,
долж ны уменьш ится с увеличением вероятности. Ответы в условии 80-18
не следуют этой модели. В общем, "знаю щ ие" испытуемые используют пра­
вило комбинации, которое подобно МТБ, но оно несколько избыточно по от­
ношению к МТБ.
Гипотеза тенденции угады вания в многоступенчатом выводе явно под­
держ ана "незнаю щ ими" испытуемыми. Очевидно, из-за сложности ситуа­
ции некоторые испытуемые были склонны сосредотачиваться почти полно­
стью на наиболее вероятном событии в последующих стадиях вывода. Эф­
ф ект угады вания в многоступенчатом выводе, к ак и консерватизм в выводе
с одной стадией (W .Edw ards, 1966), по-видимому, является другим приме­
ром общей неспособности сочетать сложную информацию. Так к ак больш ая
часть процесса обработки информации людей является многоступенчатой
и вероятностной по характеру, дальнейш им ш агом в применении теоремы
Байеса явл яется нахож дение способов, к а к помеш ать лю дям соверш ать
ош ибки, игнорируя все, кроме наиболее вероятных событий промежуточ­
ного уровня.
27. Заключения о личных характеристиках на
основе информации, восстановленной из памяти*

Яков Троуп

Социальные оценки часто основываются на неточном вспоминании поведе­


ния других людей. Нас часто просят сделать выводы относительно харак­
терных черт других людей, даж е когда мы не уверены, что можем вспом­
нить, к ак они в действительности вели себя. П ри таких обстоятельствах нам
приходится основывать наш у атрибуцию на неопределенном поведенческом
доказательстве. Н астоящ ее исследование посвящ ено изучению того, дей­
ствительно ли люди вклю чаю т этот источник неопределенности в их оцен­
ки других людей и к ак они это делаю т....

М одель Б а й е с а д л я в ы в о д о в и з за п о м н е н н о го п о в ед ен и я
В настоящ ем исследовании испытуемые оценивали вероятности того, что
некоторые субъекты обладают определенными признакам и, на основе соб­
ственной ненадежной выборки поведения субъектов. Чтобы проверить ги­
потезу, что эти субъективные вероятности будут несправедливо высокими
и недостаточно чувствительными к надежности, их сравнили с оптималь­
ными вероятностями. Последние были получены из модели Байеса, кото­
рая бы ла разработана исследователями многоступенчатого вывода вероят-
ности(см. P eterson, 1973). Н ачинаясь с одноступенчатого вывода от действи­
тельного поведения В. до характеристик личности А., теорема Байеса при­
нимает следующую привычную форму

Р(А ; / В;) = Р(А)Р(В. / А ) / P(R ) (1)

где (А / В;) - апостериорная вероятность А , учиты вая В^ Р(А;) - априорная


вероятность А4, Р(В ) - полная вероятность Bj( P(Bj / А4) - условная вероят­
ность В., при условии А.. П оследняя вероятность представляет диагности­
ческое значение поведения, принимая во внимание характерны е признаки
актора. А постериорная вероятность Р(А; / В}) может быть получена для к аж ­

*Данные впервые появились в The Journal of Personality and Social Psychology, 1978, 36,
93-106. Авторское право © 1978 принадлежит Американской психологической ассоциации.
Перепечатано в соответствии с разрешением.
432 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
дого акта поведения, который может выбрать актор. Наблюдатели не зна­
ют, какой акт поведения был выбран в действительности. Они могут только
вывести вероятности поведения из того, что они действительно помнят, В*.
У читы вая это заклю чение, теорема Байеса принимает вид

Р(В] / В*) = P(Bj)P(B* / В.) / Р(В*) (2)

Где Р(В. / В*) - апостериорная вероятность действительного поведения В.,


учиты вая, что В* было вспомнено; Р(В.) - априорная вероятность В., Р(В*) -
полная вероятность того, что запомнили В*, учиты вая, что действительное
поведение человека - В.. Р(В. / В*) отраж ает достоверность - чем выш е ве­
роятность того, что выбрано действительное поведение, тем выш е достовер­
ность.
М одель Байеса двухступенчатого вывода сочетает значения P(AS/ В^,
полученные для каждого действительного акта поведения через Уравнение 1,
в оцененное среднее, с апостериорной вероятностью каж дого акта поведе­
н и я, P(Bj / В*), полученного из У равнения 2, служащ его как оценка. Таким
образом, апостериорная вероятность характерного признака, учиты вая, что
было выбрано определенное поведение P(Bj / В*), может быть сформулиро­
вано:

P ß i / B * ) = ^ lP ( A i / B j) P ( ß jl В*) (3)
j

У равнение 3 вы раж ает количественно нормативные соображения, которые


были обсуждены ранее. Так к ак P(At / В.) является возрастающ ей ф ункци­
ей Р(В. / А.) (диагностичность) и Р(В. / В*) является возрастающ ей ф ункци­
ей Р(В* / В ) (достоверность), P(Aj / В*) долж на возрастать, к ак с достовер­
ностью, так и с диагностичностью , и эффект одной переменной долж ен за­
висеть от уровня другой. Рассмотренное в терминах теории информацион­
ной интеграции А ндерсена (1974), каж дое выбранное поведение имеет оп­
ределенный вес в оценивании вероятностей признаков. В свою очередь, вес
рассматривается к ак мультипликативная ф ункция диагностичности пове­
дения и достоверности выборки. П равило интеграции, приписанное Урав­
нением 3, мож ет быть применено к ак к одноступенчатому оптимальному
выводу (т.е. значения P(A t / Bj) и Р(В; / В*), полученные из У равнения 1 и 2,
соответственно), так и к субъективному одноступенчатому выводу (т.е. соб­
ственные оценки испытуемых Р(А; / В.) и P(Bj / В*)). В первом случае и од­
ноступенчатые выводы, и их интеграция являю тся оптимальными (т.е. Б ай ­
еса), а во втором случае оптимальна только интеграция. Настоящ ее иссле­
дование сравнивает наблюдаемые вероятности с двумя видами спрогнози­
рованны х вероятностей. Испытуемые делали выводы о зачислении студен­
тов в аспирантуру и о политических взглядах студентов. Первые выводы
Заключения о личных характеристиках на основе... 433
были основаны на вспоминании оценок студентов, а вторые - н а вспомина­
нии поведения студентов.

Э к сп ер и м ен т 1
М ет од
Введение. Сначала испытуемым предложили оценки студентов на старш ем
курсе. Позднее им приш лось вспоминать оценки и оценивать вероятность
того, что каж ды й студент был зачислен в аспирантуру ш колы бизнес-уп­
равления. Эта задача подразумевает 2 логических ш ага: (а) от вспомненной
оценки (G*) к реальной оценке студента (G); (Ь) от реальной оценки к тому,
был ли студент зачислен или нет в аспирантуру (А). Неопределенностью
последнего ш ага управляли посредством изменения диагностического зна­
чения оценок, принимая во внимание зачисление в ш колу бизнес-управле­
ния. Оценки низкой диагностичности были выпускными оценками по пред­
мету «Введение в антропологию », а оценки высокой диагностичности были
выпускны ми оценками по предмету «Введение в экономику». Надежность
воспоминаний управлялась за счет изменения числа студентов, чьи оценки
необходимо было вспомнить.
Процедура. Испытуемым сказали, что в определенный год было принято
50% претендентов на поступление в ш колу бизнес-управления. Таким об­
разом, априорная вероятность быть приняты м и не быть приняты м , Р(Ау) и
Р(Ап) бы ла 0.50. Испытуемым сказали, что они будут оценивать вероятность
зачисления для студентов, выбранных наугад. Им такж е сообщ или, что
оценки будут основаны на том, были ли оценки студента в данном предмете
ниж е 75 (Gj) или выш е 75 (Gh) по ш кале от 0 до 100.
Манипуляции с диагностическим значением. Два распределения веро­
ятностей (каж дое представлено в виде столбчатой диаграммы) соотнесли
оценки и зачисление. Одна диаграмма показы вала доли зачисленны х сту­
дентов, которы е получили Gj или Gh. Эти доли представляли условные ве­
роятности P(G j/A y) и P(Gh/A y). Д ругая диаграмма показы вала пропорцию
не зачисленны х студентов, которые получили эти оценки, то есть P(G j/A n)
и P(Gh/A n). Д иаграмма для оценок высокой диагностичности (курс по эко­
номике) показы вала следующие доли: P(G1/A n) = P(Gh/A y) = 0.85 и P(G1/A y)
= P(Gh/A n) = 0.15. Диаграмма для оценок низкой диагностичности (курс по
антропологии) показы вала следующие доли: P(G1/A n) = P(Gh/A y) = 0.55 и
P(G j/A y) = P(Gh/A n) = 0.45. Каждый испытуемый оценивал две выборки сту­
дентов, для одной были предложены оценки высокой диагностичности, а
для другой — оценки низкой диагностичности. П орядок представления был
сбалансирован среди испытуемых.
Манипуляции с достоверностью. Обширное предварительное испытание
показало, что определенный уровень достоверности может быть получен,
434 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
за счет изменения количества студентов, чьи оценки необходимо вспомнить.
Испытуемым сообщили, что половина выборки получила низкие оценки, а
другая половина - высокие, и что им предложат список студентов, полу­
чивш их высокие оценки. Д ля того чтобы сделать минимальным различие
между пунктами этого списка стимула, студенты были обозначены двузнач­
ными числами. Ч исла произносились магнитофоном со скоростью одно чис­
ло в секунду. Высокий тон означал конец каж дого списка стимула. Двумя
секундами позж е список испы тания представлялся с помощью магнитофо­
на. Список испы тания состоял из 8 двузначных чисел, 4 из которых встре­
чались в списке стимулов (т.е. числа Gh) и 4 не встречались в списке (т.е.
числа Gj). Четы ре числа Gh в списке испы тания были взяты из полного ряда
серийны х позиций в списке стимула. П орядок чисел Gt и Gh был случайно
определен для каж дого списка испы тания. К аждые 10 секунд проходило
одно испытание. В промеж утках испытуемым было необходимо указать,
является ли оценка студента G1или Gh и оценить вероятность того, что сту­
дент был зачислен в аспирантуру Р(А у / G*), и вероятность, что он не был
зачислен P(An / G*). Предварительное испытание показало, что 10-секунд­
ного промеж утка вполне достаточно, чтобы сделать оценки.
И спользовались три вида списков: из 4, 7 и 14 пунктов. Данные, полу­
ченные из предварительного испы тания, показываю т что процент правиль­
ны х опознаваний варьировался от 60% в длинном списке (условие низкой
достоверности), 75% в среднем списке (условие средней достоверности) до
90% в коротком списке (условие высокой надежности). Каждый испытуе­
мый отвечал на список высокой и низкой диагностичности. Наборы чисел е
этих списках были уравновешены с диагносточностью. Двадцать испытуе­
мых были распределены к каж дому из трех условий надежности.
Условие полной достоверности. В этом условии одноступенчатого вывода
группа из 46 испытуемых оценивала вероятность зачисления, исходя из
оценок, которые были точно известны, Р(А у /G ) и P(An /G ). Испытуемым
предлож или буклет с диаграммами (т.е. информацию диагностичности) и
оценки студентов. После ознакомления с оценками студентов, испытуемые
отмечали оценки вероятности. Каждый испытуемый оценивал студентов с
оценками низкой и высокой диагностичности. Д ля половины испытуемых
оценки были низким и, а для другой половины - высокими.
Испытуемые. Всего в эксперименте принимало участие 106 человек (42
м уж чины и 64 ж енщ ины ), проходивш их вводный курс по психологии в
Еврейском университете в Иерусалиме. Участие в эксперименте было час­
тичны м выполнением требований курса.

Р езульт ат ы и обсуждение
Доли верно опознанны х низких оценок, P(G*j / G j), и вы соких оценок,
P(G*h/ Gh), служ или мерами достоверности каждого испытуемого. Средние
Заключения о личных характеристиках на основе... 435
величины P(G*, / G,) и P(G*h / Gh) показали ближайш ий случайный уро­
вень вы полнения в условиях низкой достоверности (список из 14 пунктов)
(М = 0.54 и 0.60 соответственно), хорошее выполнение в условиях высокой
достоверности (список из 4 пунктов) (М = 0.93 и 0.89, соответственно), и сред­
нее вы полнение в условиях средней достоверности (список из 7 пунктов)
(М = 0.73 и 0.77, соответственно). А нализ изменения (Достоверность х Ди-
агностичность) этих долей вы явил высоко значимые эффекты достовернос­
ти, F(2,57) = 37.06, р < 0.001, и F(2,57) = 20.17, р < 0.001 на P(G* / G,) и
P(G*h / Gh), соответственно. Другие источники изменений не были значи­
мы.
Данные, полученные из условия полной достоверности, ясно показы ва­
ют эффект влияния манипуляции с диагностичностью на одноступенчатый
вывод и з оценок, которы е точно известны , до вероятности зачисления,
P(A /G ). Испытуемые вывели более высокие P(An/G ,) и P(Ay/G h) из оценок
высокой диагностичности (М = 0.81 и 0.78, соответственно), чем из оценок
низкой диагностичности (М = 0.57 и 0.55, соответственно), различие было
значимы м, как для P(An/G 1), так и для P(Ay/G h), t(22) = 8.08, р < 0.001 и
t(22) = 8.59, р < 0.001, соответственно.
Теперь обратимся к оптимальной апостериорной вероятности зачисления,
учиты вая вспомненную оценку, P(A/G*). Эти вероятности были определе­
ны для каж дого испытуемого, объединив вероятности действительных оце­
нок, учиты вая вспомненные оценки, P(G/G*) и вероятность зачисления,
учиты вая действительные оценки, P(A /G ), в соответствии с Уравнением 3.
Значения P(G/G*) были подсчитаны для каж дого испытуемого с помощью
Уравнения 2 из собственной достоверности при вспоминании оценок P(G*/G).
Значения P(A /G ) были средними значениями оценок, полученных в усло­
виях полной достоверности. Таким образом, оптимальная апостериорная
вероятность зачисления, учиты вая вспомненные оценки, P(A /G *), основы­
валась на субъективном одноступенчатом выводе от действительных оце­
нок до вероятности зачисления, и на оптимальном одноступенчатом выводе
(Уравнение 2) от вспомненных оценок к действительным оценкам. П унк­
тирны е линии в левой части Рисунке 1 представляю т средние значения
P(An/G *1), оптимальную вероятность того, что студент не был зачислен, учи­
ты вая, что его оценка была вспомнена к ак низкая; пунктирные линии в пра­
вой части Рисунке 1 представляю т средние значения P(Ay/G *h), оптималь­
ную вероятность того, что студент зачислен, учиты вая, что его оценка была
вспомнена к ак вы сокая.1Ясно, что согласно модели Байеса, эти вероятнос­
ти возрастут вместе с достоверностью и диагностичностью, и что эффект до­
стоверности будет виден при высокой диагностичности, а не при низкой.

1 Другой набор оптимальных значений P(A/G*) был подсчитан, исходя из оптимальных


значений P(A/G), полученных из Уравнения 1. Эти вероятности не рассматриваются от­
дельно, так как они были близки к оптимальным значениям P(A/G*), полученным из субъек­
тивных оценок P(A/G).
436

Низкая степень Высокая степень


МНОГОСТУПЕНЧАТАЯ ОЦЕНКА

Рис. 1. Наблюдаемая и оптимальная вероятности (P fA /G ,*) и P(Ay/G, *)) к ак ф ункция до­


стоверности и диагностичности (Эксперимент 1)
Заключения о личных характеристиках на основе... 437
Два наблюдаемых значения были определены для каждого испытуемо­
го: первое - среднее значение P(An/G *j), которое он оценил для студентов,
которые, к ак он помнит, имели высокие оценки. Сплошные линии на Ри­
сунке 1 показываю т, что эта вероятность отличается к ак качественно, так и
количественно от оптимальной вероятности. Диагностическое значение дей­
ствительной оценки является единственным фактором, который имел по­
стоянное влияние на наблюдаемые P(An/G 1*) и P(Ay/G h*), F (l,5 7 ) = 96.97,
pcO.OOl h F(1,57) = 114,82, p < 0.001, соответственно. Чем выш е диагности­
ческое значение действительных оценок, принимая во внимание зачисле­
ние, тем более крайними являю тся апостериорные вероятности. Достовер­
ность, с которой были узнаны действительные оценки, имела очень малень­
кое и непоследовательное влияние на выводы (F < 1). Д аж е выводы на двух
крайних уровнях достоверности в пределах каж дого уровня диагностично-
сти значительно не отличались. Другими словами, выводы не были менее
крайним и, когда степень правильны х узнаваний была близка к случайно­
му уровню, а не когда она была почти совершенной. Выводы испытуемых
такж е не показы вали взаимодействия Диагностичность - Достоверность,
спрогнозированную моделью Байеса. Влияние диагностичности действи­
тельных оценок не уменьш алось с уменьшением достоверности. Согласо­
ванное влияние этих переменных было проверено на уровне выводов о сту­
дентах. Нормативно, изменение в уверенности в оценках различны х сту­
дентов должно повлиять в большей степени на выводы об их зачислении,
когда оценки обладают высоким диагностическим значением, чем когда их
диагностическое значение - низкое. Следовательно, выводы о студентах,
внесенных в список высокой диагностичности, должны больше различать­
ся, чем выводы о студентах, внесенных в список низкой диагностичности.
Изменение P(A/G*) для 8 студентов в пределах каж дого из двух списков,
было подсчитано для каж дого испытуемого. В отличие от модели Байеса,
эти изменения значимо не различались, t(59) = 1.63.
Рисунке 1 такж е показы вает, что наблюдаемые вероятности были более
крайним и, чем оптимальные вероятности. Среднее различие между наблю­
даемы ми и оптимальны ми вероятностями было сущ ественным к ак для
PCAyGj*), так и для P(Ay/G * ,), F (l,5 7 ) = 33.38, р < 0.001, и F (l,5 7 ) = 84.67,
р<0.001, соответственно. Д ля испытуемых были подсчитаны коэффициен­
ты корреляции между оптимальными и наблюдаемыми вероятностями в
пределах каж дого из 6 условий. Корреляции были незначительными и не­
последовательными, 5 корреляций были положительными и 7 — отрица­
тельными. Две корреляции были значимыми, но отрицательными (г= - 0.50,
р < 0.05 и г = -0 .5 5 , р < 0.01 для P(A n/G 1*) и P(Ay/G h*), соответственно, в
условиях низкой и высокой диагностичности).
Эти результаты показываю т, что испытуемые не смогли учесть сообра­
ж ения достоверности в своих выводах вероятности. Испытуемые основы­
вали свои выводы только на диагностическом значении действительных
оценок. Вероятности, выведенные в экспериментальны х условиях, были
438 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
несколько ниж е, чем вероятности, выведенные в условии полной достовер­
ности, показы вая, что испытуемые не полностью усвоили стратегию “к ак
будто” (т.е. делать выводы, как будто действительные оценки были точно
известны). Однако уменьш ение уверенности было маленьким и постоянно
не изменялось с изменением достоверности. К ак результат, в сравнении с
вероятностями Байеса, выводы испытуемых были крайними. Заметим, что
это было не так при одноступенчатом выводе от действительных оценок до
зачисления, P(A/G). Вероятности, выведенные при условии полной достовер­
ности, были близки к оптимальным вероятностям, выведенным из модели
одноступенчатого вывода Байеса (Уравнение 1). Этот результат предполага­
ет, что неоптимальность (или самонадеянность) в условии двухступенчатого
вывода, появилась благодаря введению дополнительного источника неопре­
деленности - несовершенному вспоминанию действительных оценок...

Э к сп ер и м ен т 4
М ет од
В этом эксперименте испытуемые оценивали вероятности того, что студен­
ты муж ского пола выступают за (Ар) или против (Ап) возвращ ения Западно­
го берега (территории, занятой И зраилем в войне 1967года) арабам. Голосо­
вание за лейбористскую партию (относительно миролюбивую партию) или
за партию Л икуд (Likud) (достаточно воинственную партию) служило как
инф ормация низкой диагностичности. П редварительный эксперимент по­
казал , что короткие волосы и голосование за партию Л икуд (Вп) подразуме­
вало отрицательное отношение к возвращ ению Западного берега, а длин­
ные волосы и голосование за лейбористов (Вр) являлось показателем поло­
ж ительного отнош ения. П редварительный эксперимент такж е показал, что
голосование студентов является более показательны м, чем длина волос.
Задача на вспоминание и другие аспекты проекта и процедуры были таки­
ми, как и в Эксперименте 1. 20 испытуемых были распределены по каждому
из трех условий достоверности.
Дополнительная группа, состоящая из 57 испытуемых, была распределена
по условию полной достоверности. При этом условии испытуемые точно знали
длину волос студентов или партию, за которую они голосовали. Каждый испы­
туемый оценивал вероятности отношения, исходя из ношения коротких во­
лос, длинных волос, голосования за лейбористов и голосования за партию Ли­
куд.
В общей сложности в эксперименте 4 приняло участие 117 испытуемых
(51 мужчина и б б женщ ин), которые проходили вводный курс по психологии в
Еврейском университете в Иерусалиме.
Наблюдаемая низкая диагностичность
Наблюдаемая высокая диагностичность
Оптимальная низкая диагностичность
Заключения о личных характеристиках на основе

ти и диагностичности (Эксперимент 4)
439
440 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
Р езульт ат ы и обсуждение
М анипуляция с достоверностью имела сильное влияние на степень верных
узнаваний к ак Вп(т.е. короткие волосы или голосование за партию Л икуд),
та к и В р(т.е. длинные волосы и голосование за лейбористов), F(2,57) = 55.45,
р < 0.001 и F(2,57) = 22.04, р < 0.001, соответственно. Средние значения
Р(Вр*/В р) б ы л и 0 .6 1 ,0 .8 2 и 0 .9 1 . Эффект диагностичности и его взаимодей­
ствие с достоверностью были незначимыми.
К ак и ожидалось, значения Р(А /В ), выведенные испытуемыми в услови­
ях полной достоверности показываю т, что субъективное диагностическое
значение голосования было больш им, чем длина волос. Таким образом, ве­
роятности отнош ений Р(Ап/В п), выведенных из того ф акта, что студенты,
голосовавш ие за партию Л икуд, (М = 0.78) были более крайними, чем те,
которые были выведены из того ф акта, что студенты носили короткие воло­
сы (М = 0.52), t(56) = 13.61, р < 0.001. Подобным образом, вероятность от­
нош ения Р(А /В р), выведенная из ф акта, что студенты голосовали за лейбо­
ристов (М = & 75) была более крайней, чем те, которые были выведены из
ф акта, что студенты носили длинные волосы (V= 0.53), t(56) = 9.89, р < 0.001.
Оптимальные и наблюдаемые вероятности показаны на рис.2. Первые
были получены от каждого испытуемого через Уравнение 3 от значений Р(В/В*)
(рассчитанные через Уравнение 1 от достоверности испытуемого в опреде­
лении поведения студентов, Р(В*/В)) и из средних значений Р(А /В ), полу­
ченны х в условиях полной достоверности. Можно видеть, что только диаг-
ностичность поведения учитывалась и обеспечивала выводы вероятностей
отношения F(1,57) = 68.94, р < 0.001, и F(1,57)= 90.40, р < 0.001 для Р(Ап/В п*)
и Р(Ар/В р*), соответственно.2 При наруш ении модели Байеса основное вли­
яние достоверности и её взаимодействие с диагностичностью были незначи­
мы. Кроме того изменения наблюдаемых вероятностей в пределах списков
высокой диагностичности были не больше, чем изменения в пределах спис­
ков низкой диагностичности, t(59) =0.59. К ак и в предыдущ их эксперимен­
тах, наблюдаемые вероятности были более крайними, чем оптимальные ве­
роятности F (l,5 7 ) = 5.68, р < 0.05 и F (l,5 7 ) = 27.63, р < 0.001 для Р(Ап/В п*)
и Р(Ар/Вр*), соответственно. Н аконец, из двенадцати корреляций для ис­
пы туемых при условиях между наблюдаемыми и оптимальными вероятно­
стям и восемь были положительными, но только две были значимыми: г =
0.436, р < 0.05 для Р(Ап/В п*) при условии высокой диагностичности и высо­

2 Необходимо отметить, что эти результаты не могут быть приписаны к тому факту, что
диагностичностью управляли как внутригрупповой переменной, а достоверностью как меж­
групповой переменной. Был проведен дисперсионный анализ по выводам первого списка
студентов, чьё поведение обладало низким диагностическим значением для половины ис­
пытуемых в каждом условии достоверности и высоким диагностическим значением для
другой половины. В этом анализе диагностичность рассматривалась как межгрупповой
фактор. Эти анализы показали значимое влияние диагностичности и незначимое влияние
достоверности и обоих факторов вместе (диагностичность х достоверность). Дисперсионный
анализ данных предыдущих трёх экспериментов показал похожие результаты.
Заключения о личных характеристиках на основе... 441
кой достоверности и г = 0.402, р < 0.05 для Р(Ар/В р*) при условии низкой
диагностичности и высокой достоверности.
Эксперимент 4 обеспечивает дополнительную поддержку для обобщения
наш их выводов. Он показы вает, что смещ ения, наблюдаемые в предыду­
щ их экспериментах, такж е влияю т на выводы о характеристиках личнос­
ти за счет вспомненного поведения. Диагностичность действительного по­
ведения субъектов являлась единственным фактором, определяющ им вы ­
воды даж е когда диагностичность долж на основываться на собственных
убеж дениях испытуемых без получения свидетельства извне.

О бщ ее об суж д ен и е
Выводы, которые наш и испытуемые сделали исходя из собственных нена­
дёж ны х воспоминаний, систематически наруш али нормативные правила
вывода вероятности. Испытуемые были склонны полагаться на диагностич­
ность информации, не принимая во внимание достоверность, не смотря на
тот ф акт, что они знали о недостоверности своих воспоминаний.
Действительно, сравнения между выводами, исходя из верно вспомнен­
ной информации (например, выводы исходя из оценок, которые были вспом­
нены к ак низкие и которые действительно были низкими) и выводы, исхо­
дя из неверно вспомненной информации (например, выводы исходя из оце­
нок, которые были вспомнены к ак низкие, но которые в действительности
были высокими), показали незначительные различия во всех четырёх экс­
периментах. То есть последние выводы вероятности были не менее крайни­
ми, чем первые. Эти результаты соответствуют точки зрения, что люди
склонны уменьш ать сложность задач, используя простые правила эвристи­
ки . Недооценивание информации достоверности может отраж ать исполь­
зование одной такой эвристики суж дения — эвристики репрезентативнос­
ти (K ahnem an & Tversky, 1973, 4). Например, вспоминая партию , за кото­
рую голосовал субъект, испытуемые оценивали вероятность того, что он
является сторонником возвращ ения западного берега арабам, по степени, в
которой голосование за такую партию репрезентативно стереотипу субъек­
та, поддерживающ его подобное мнение.
Субъект, голосующий за милитаристскую партию, олицетворяет больше
черт этого стереотипа, чем субъект, который носит длинные волосы. (И в пер­
вых трёх экспериментах вы сокая оценка по экономике является более репре­
зентативной для студентов, зачисленных в ш колу управления бизнесом, чем
вы сокая оценка по антропологии.) Положительное отношение к возвраще­
нию территории было выведено с большей уверенностью в первом случае.
Точность воспоминания не влияла на эти вероятности, потому что она не зат­
рагивала оцененную репрезентативность вспомненного поведения.
П ринимая это во внимание, достоверность доклада сравнима с соображе­
ниям и размера выборки и базовыми значениями. Размер выборки, на кото­
рой основывается свидетельство и базовое значение выведенного отноше­
442 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА
н и я не влияю т на подобие меж ду свидетельством и признаком . П онятие
репрезентативности предполагает, и исследование показало, что люди не об­
ращают внимания на эти соображения, делая выводы (N isbett & Borgida, 1975,
Tversky & K ahnem an, 1974,1). На основании этого можно ожидать, что дос­
товерность будет приниматься во внимание в тех случаях, когда она влияет
на репрезентативность доклада. Таким образом, неверное воспоминание ре­
альны х поведенческих особенностей (благодаря таким факторам, как проме­
ж уток времени, с которого особенность была зарегистрирована), которые де­
тализированы больше, чем простые бинарные события, включённые в насто­
ящ ее исследование, вероятно, будет влиять на ясность, полноту и яркость
вспоминаемой информации. Т акая неясная информация может быть менее
репрезентативна рассматриваемому признаку, и соответственно, производит
более регрессивные и более умеренные оценки вероятности...
З а к л ю ч ен и я о ли чн ы х хар а к тер и сти к ах на осн о в е... 443
Часть VIII
Коррективные процедуры
28. Устойчивая привлекательность ошибочных
линейных моделей при принятии решений*

Р оби н М . Д а у э с

К нига П оля М ила (Paul Meehl) Клиническое прогнозирование в сравнении


со статистическим: теоретический анализ и обзор доказательств
(Clinical V ersus S tatistical P rediction: a T heoretical A nalyses and a review of
the Evidence) появилась 25 лет назад. В ней рассматриваю тся доказатель­
ства того, что числовые критериальны е переменные психологической на­
правленности (например, рейтинги способностей аспирантов, которые по­
лучили докторскую степень) от числовых предсказываю щ их переменных
(например, оценки на выпускном экзамене, уровень средних оценок, рей­
тинг рекомендательных писем) лучш е осущ ествляю тся посредством верных
линейны х моделей, чем клинической интуицией людей, имеющ их опыт в
таких предсказаниях. Основная идея зтой статьи — это рассмотреть дока­
зательства того, что даж е лож ные линейны е модели могут превосходить
клинические предсказания.
Верная линейная модель - это та, в которой веса, приписанные предска­
зываю щ им переменным, выбраны таким образом, чтобы оптимизировать
отнош ение меж ду предсказанием и критерием. Простой регрессионный
анализ - это наиболее обычный пример верной линейной модели; предска­
зывающие переменные взвеш иваю тся таким образом, чтобы максимизиро­
вать корреляцию между результатом по формуле и действительным значе­
нием критерия. Дискриминантный анализ - это другой пример верной ли ­
нейной модели, веса приписываются предсказывающ им переменным таким
образом, чтобы результирующие линейные формулы максимизировали раз­
личия меж ду двумя или более группами. Регрессионный анализ гребня
(D arlington, 1978, M arquardt & Snee, 1975), другой пример, попытки при­
писать веса таким образом, что итоговые значения максимально коррели­
руют с реальны м позателем в новом наборе данных.
Таким образом, существует множество типов верных линейных моделей,
и они использую тся в различны х контекстах. Один пример (Dawes, 1971)
рассматривает прогнозирование ф акультетских рейтингов аспирантов. Все

*Этот раздел впервые появился в American Psychologist, 1978,34,571-582 Авторское право


© 1979 принадлежит Американской психологической ассоциации. Перепечатано в соот­
ветствии с разрешением.
448 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
аспиранты отделения психологии У ниверситета ш тата Орегон, которые
были приняты в период с осени 1964 по осень 1967 - и те, кто выбыл из про­
граммы по неакадемическим причинам (например, психическое заболева­
ние или вступление в брак) - были оценены весной 1969 года; сотрудники
ф акультета оценили только тех студентов, в ком они были уверены. Исполь­
зовалась следую щ ая оценочная ш кала: 5 - выдаю щ ийся, 4 - выше средне­
го, 3 - средний, 2 - ниж е среднего, 1 - выбывш ий из программы по акаде­
мическим трудностям. Такие оценивания являю тся психологически инте­
ресными критериям и, потому что субъективные впечатления сотрудников
ф акультета являю тся главными детерминантами работы (если он идет ра­
ботать), которую студент получает после окончания аспирантуры. В каче­
стве выборки выступили 111 студентов, количество сотрудников ф акульте­
та, оцениваю щ их каж дого из этих студентов, варьировалось от 1 до 20, со
средним - 5.67 и медианой - 5. Оценки были надежными. (Чтобы опреде­
лить надеж ность, оценки были подвергнуты однофакторному дисперсион­
ному анализу, при котором каж ды й оцениваемый студент принимался за
единицу анализа. Результирующ ее отношение межгрупповых дисперсий
(п2) было 0.67, и находилось ниж е уровня значимости 0.001). Эти ф акуль­
тетские рейтинги прогнозировались по проверенной линейной модели, ос­
нованной на оценках вы пускны х экзаменов, средних оценок на старш их
курсах и меры избирательности студентами образовательных курсов.12Под­
тверж денная перекрестными исследованиями множественная корреляция
между факультетским рейтингом и предсказывающ ими переменными была
0.38. В соответствии с результатами М ила, корреляция последних ф акуль­
тетских рейтингов со средними оценками сотрудников приемной комиссии,
которая отбирала студентов составила 0 ,192, то есть она объясняла одну7чет­
вертую общей дисперсии. Этот пример типичен для психологических ис­
следований в данной области: (а) корреляция с предсказаниям и модели
вы ш е, чем корреляция с клиническим прогнозом, но (Ь) обе корреляции
низкие. Подобные характеристики часто приводят психологов к следующей
интерпретации вывода: в то время, к ак н изкая корреляция модели показы ­
вает, что линейное моделирование является несостоятельным к ак метод,
низкие корреляции экспертов означаю т лиш ь то, что использовались пло­
хие эксперты .

1 Этот индекс основывался на оценке избирательности Cass & Birnbaum (1968), в их книге
«Сравнительное руководство к американским колледжам» (Comparative Guide to American
Colleges). Этим устным категориям избирательности приписали численные значения, в со­
ответствии со следующим правилом: наиболее избирательные - 6, сильно избирательные -
5, очень избирательные(+) - 4, очень избирательные - 3, избирательные - 2, не упомянутые
- 1.
2 К сожалению, только 23 из 111 студентов можно использовать в этом сравнении, потому
что оценочная шкала, используемая комиссией, слегка изменялась от одного года к друго­
му.
Устойчивая привлекательность ошибочных ... 449
Л ож н ая л и н ей н ая модель — эта та, в которой веса вы браны неким
неоптимальным методом. Они могут быть выбраны с условием равенства,
они могут быть выбраны, основываясь на интуиции человека, делающего
прогноз, или они могут быть выбраны случайным образом. Тем не менее,
ложные модели могут быть очень полезными. Когда, например, стандарти­
зированные оценки выпускных экзаменов, средние оценки на старш их кур­
сах и индексы избирательности в предыдущем примере были равно оцене­
ны, итоговый результат коррелировал к ак 0.48 с последним факультетским
рейтингом. К орреляция была не только выш е, чем при клиническом оце­
нивании комиссии (0.19), но она такж е была выш е, чем полученная на ос­
нове значений, взяты х из половины выборки.
Пример ложной модели, который может быть интересен — по крайней
мере, ш ирокой публике — был инициирован врачом, который входил в со­
став комиссии вместе со мной, когда я занимался системой прогнозирова­
ния. Позднее, находясь в баре со своей женой и со мной, он сказал, что моя
статья могла быть интересна моим коллегам, но успешное обучение в аспи­
рантуре в области психологии не представляет особого интереса: "Мог бы
ты, например, использовать одну из своих ложных моделей, чтобы пред­
сказать, на сколько хорошо мы ладим с женой" — сказал он. Я понял, что
мог бы или возможно смог бы. В то время психологическое отделение уни­
верситета ш тата Орегон занималось гендерными исследованиями, большин­
ство из которы х были поведенчески ориентированы. Таким образом, участ­
ники этих исследований фиксировали, когда они занимались любовью, ког­
да они ссорились и когда они встречались (например, с родственниками суп-
руга/супруги) и т.д. Эти испытуемые такж е делали субъективные оценки
относительно того, насколько счастливы они были в семейной ж изни. Я сра­
зу ж е подумал о лож ны х линейных моделях, чтобы спрогнозировать само­
оценки семейного счастья: количество раз занятия любовью минус количе­
ство ссор. Мой коллега Джон Ховард (John Howard) собрал такие данные о
супружеских парах, когда он был аспирантом в университете ш тата Миссу­
ри, Канзас-Сити, где он работал с А лександер (A lexander, 1971). После того,
как бы ла установлена достоверность оценивания занятий любовью и ссор,
А лександер просила одного супруга из 42 пар контролировать эти события.
Она позволила нам анализировать данные, которые были получены: "В 30
парах, которые счастливы в браке (по мнению контролирую щ его супруга),
только две ссорились чащ е, чем занимались любовью. Все 12 пар, несчаст­
ливых в браке, ссорились гораздо чащ е" (Howard & Dawes, 197б, с.478). Мы
повторили это исследование в университете ш тата Орегон, где 27 контроли­
рующих супругов оценили счастье по 7-бальной ш кале, от "очень несчаст­
ны" до "очень счастливы" с нейтральным средним баллом. К орреляция ч а­
стоты занятий любовью минус частота ссор с этими оценками супружес­
кого счастья составила 0.40 (р<0.05), ни одна из переменных не была значи­
ма сама по себе. Исследование было повторено в ш тате Миссури Эдвардсом
и Эдвардсом (Edw ards & Edw ards, 1979) и в Техасе Торнтоном (T hornton,
450 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
1977а), которые обнаружили корреляцию 0.81 (р < 0.01) между различием
секс-ссоры и самооценками супружеского счастья среди 28 новых пар. (При­
чина намного большей корреляции мож ет быть в том, что Торнтон получил
оценки супружеского счастья после, а не до того, к ак испытуемые фиксиро­
вали занятия любовью и ссоры; действительно, одна из испытуемых реш и­
ла развестись, осознав, что она чащ е ссорилась, чем занималась любовью;
T hornton, 1977b). Вывод заклю чается в том, что если мы любим больше,
чем ненавидим, мы счастливы; если мы ненавидим больше, чем мы любим,
мы несчастны. Этот вывод не является глубоким, ни психологически, ни
статистически. Однако эти грубые лож ные линейные модели прогнозиру­
ют очень важ ную переменную: оценки семейного счастья.
Большой объем литературы (в действительности, весь) со времени публика­
ции (1954) книги Мила поддерживает его обобщение о верных линейных моде­
лях вместо интуитивных клинических оценок. Сойер (Sawyer, 1966) пересмот­
рел большое количество подобных исследований, а некоторые из этих исследо­
ваний были весьма обширными (Goldberg, 1965). Через 10 лет после опублико­
вания его книги, Мил (1965) смог сделать вывод, что существовал единствен­
ный пример, который показывал, что клинические оценки дают лучшие ре­
зультаты, и это было сразу ж е оспорено Голдбергом (1968а) на основании того,
что даже этот пример не показывает существенного превосходства. Холт (H olt,
1970) критиковал детали некоторых исследований, и он даже предположил,
что прогноз, в отличие от понимания, не может являться важной частью кли ­
нического суждения. Однако обзор литературы не вы явил других исследо­
ваний, в которых клиническое оценивание превосходило статистическое про­
гнозирование, когда они были основаны на одинаковых исходных переменных.
И хотя большинство противников позитивизма согласится, что понимание не
синонимично прогнозированию, немногие оспорят то, что оно не подразумева­
ет наличия способности прогнозировать.
Почему? Потому что люди - особенно эксперты в какой-либо области - на­
много лучше выполняют отбор и кодирование информации, чем ее интегриро­
вание.
Но люди действительно важ ны . Статистическая модель может вклю ­
чать информацию оптимальным способом, но всегда индивиды (эксперты,
кли ницисты , испытуемые) выбирают переменные. Кроме того, именно экс­
перт знает направленные отнош ения между предсказываю щ ими перемен­
ными и критерием и может закодировать переменные таким образом, что
они имеют ясные направленные отнош ения. И именно в подобной ситуа­
ции, где предсказываю щ ие переменные являю тся хорошими и где они име­
ют монотонные условные отнош ения с критерием, верная линейная модель
хорошо ф ункционирует3.

3Отношения являются условными монотонными, когда переменные могут быть распреде­


лены на шкале таким образом, что более высокие значения на каждой прогнозируют более
высокие значения по критерию. Это условие является комбинацией двух более фундамен-
Устойчивая привлекательность ошибочных ... 451
Л инейная модель не может заменить эксперта при реш ении вопроса "что
искать", но именно знание, что искать, при достижении реш ения является
именно той экспертизой, которую делают люди. Даже в такой сложной оцен­
ке к ак соверш ение хода в ш ахматах, именно способность закодировать дос­
ку правильны м способом, чтобы "увидеть” верный ход, которая отделяет
великого мастера от эксперта, а эксперта от новичка (deG root, 1965; Simon
& Chase, 1973). И не способностью интегрировать информацию различаю т­
ся эти люди (Slovic, 1972b). Мастер рассматривает не больше ходов, чем
эксперт; он просто знает, какие рассматривать. Разница между знанием того,
что искать и способностью интегрировать информацию возможно лучш е
всего проиллю стрирована в исследовании А йнхорна (E inhorn, 1972). Вра­
чи-эксперты закодировали биопсии пациентов, страдающих болезнью Ход-
гки н а, а затем в целом оценили серьёзность процесса. Эти оценки не
спрогнозировали время ж изни 193-х пациентов, все из которых умерли (кор­
реляции оценок со временем ж изни все были практически равны нулю, иног­
да даж е в неверном направлении). Переменные, которые закодировали док­
тора, однако, предсказы вали время ж изни, когда они использовались во
множественной регрессионной модели.
Таким образом, верные линейные модели работают по одной простой при­
чине. Люди хорошо выбирают верные переменные и кодируют их, таким
образом, что они имеют условное монотонное отношение с критерием. Од­
нако люди плохо интегрирую т информацию из разнообразных и несравни­
мы х источников. Верные линейные модели хороши для таких интеграций,
когда прогнозы имеют условное монотонное отношение к критерию .
Рассмотрим, например, проблему сравнения студента, желаю щ его стать
аспирантом, у которого средняя оценка вы пускны х экзаменов 750, а сред­
н яя оценка на старш их курсах 3.3, с другим, у которого средняя оценка
вы пускны х экзаменов 680, а средняя оценка на старш их курсах 3.7. Боль­
ш инство экспертов согласится, что эти показатели способностей и предыду­
щ ие достиж ения долж ны быть объединены неким компенсаторным спосо­
бом, но вопрос, как компенсировать? Многие эксперты , которые пытались
это разреш ить, мало знали о характеристиках распределений средних оце­
нок вы пускны х экзаменов и средних оценок на старш их курсах, и большин­
ство не знало об исследованиях, показы ваю щ их их надежность, к ак пока-
заиеоей успеха в аспирантуре. Кроме того, эти значения изначально не срав­
нимы без подобных знаний, оценки на выпускных экзаменах от 500 до 800

тальных условий измерения: (а) независимость (отношение между каждой переменной и


критерием не зависит от значений оставшихся переменных) и (Ь) монотонность (порядко­
вое отношение — это то, которое является монотонным), (см. Krantz, 1972, Krantz, et al.,
1971). Истинные отношения не обязательно должны быть линейными, чтобы функциони­
ровали линейные модели; они должны быть просто приближены к линейным моделям. Вер­
но то, что "для того, чтобы вычислить коэффициент корреляции между двумя переменны­
ми, отношение между ними должно быть линейным" (совет, обнаруженный в одном ввод­
ном тексте по статистике). Для начала всегда возможно что-либо вычислить.
452 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
для зачисленны х претендентов на места в аспирантуре и средние оценки на
старш их курсах от 3.0 до 4.0. Интересно, статистическая схема оценива­
н ия функционирует в таких обстоятельствах лучш е, чем эксперт?
Предположим, что в некоторых условиях невозможно построить верную
линейную модель. Одна причина, по которой мы не сможем этого сделать,
состоит в том, что размер наш ей выборки является неадекватным. При мно­
жественной регрессии, например, b весовые коэффициенты являю тся как
известно нестабильными; отношение наблюдений к предсказывающим пере­
менным должно быть таким как 15 или 20 к 1 перед тем, как b веса, которые
являю тся оптимальными, функционируют лучше на кросс-валидации, чем
делают простые единичные весовые коэффициенты. Ш мидт (Schm idt, 1971),
Голдберг (1972) и Клауди (Claudy, 1972) эмпирически продемонстрировали
эту необходимость посредством компьютерного моделирования, а Айнхорн и
Хогарт (H ogarth, 1975) и Ш ринивизан (Srinivisan, 1977) рассмотрели пробле­
му аналитически. Общее решение зависит от ряда параметров, таких как
множественная корреляция в популяции и ковариация между предсказыва­
ющими переменными. Но практический вывод ясен. Стандартный регресси­
онный анализ не может использоваться в ситуациях, где нет "подходящей"
пропорции наблюдений к предсказывающим переменным.
Д ругая ситуация, в которой верные линейные модели не могут использо­
ваться, это та, в которой не существует измеряемых критериальны х пере­
менных. Мы могли бы знать, каковы были бы важ ны е предсказываю щ ие
переменные ф актора и направления, которые они задали бы критерию , если
бы мы могли измерить критерий. Например, реш ая, какого студента при­
нять в аспирантуру, нам бы хотелось предсказать долгосрочную перемен­
ную, которая может быть названа "профессиональная сам о-актуализация".
Мы имеем представление о том, что понимать под этим понятием, но у нас
пока нет точного хорошего определения. (И даж е если бы оно было, невоз­
можно провести исследование, используя записи данных студентов, пото­
му что эта переменная может быть оценена только спустя, по крайней мере,
20 лет после написания студентами докторских диссертаций.) Однако мы
знаем, что при всех вероятностях этот критерий положительно связан с ин­
теллектом , с предыдущими достижениями и со способностью опередить сво­
их коллег. В документах наш их претендентов оценки вы пускны х экзам е­
нов оценивали первую переменную, средние оценки на старш их курсах —
вторую, рекомендательные письма — третью. Разве бы нам не захотелось
сформировать некий вид линейной комбинации этих переменных, чтобы
оценить потенциалы претендентов? У читы вая, что мы не можем провести
стандартны й регрессионный анализ, разве ничего не остается, к ак вернуть­
ся к интуитивной интеграции без посторонней помощи этих переменных
при оценивании наш их претендентов?
Один возможный способ построения ложной линейной модели - это по­
средством использования предыдущего значение для расчета последующего
(Dawes & C orrigan, 1974, L.R. Goldberg, 1970). Процесс - это построение вер­
Устойчивая привлекательность ошибочных ... 453
ной линейной модели оценки эксперта о результирующем критерии и затем,
использование этой модели вместо эксперта. На то, что подобная линейная
модель может быть точной в предсказании оценок эксперта, указано в психо­
логической литературе Хэммондом (Hammond, 1955)иХоффманом (Hoffman,
1960). (Эту работу предвосхитил 32 годами ранее Генри Волейс (H enry
W allace), вице-президент во врем я правления Рузвельта, в 1923 году в
сельскохозяйственной статье он предложил использование линейных моде­
лей, чтобы проанализировать "что н а уме у эксперта по кукурузе".) В своей
влиятельной статье, Хоффман назвал использование линейных моделей па-
раморфической репрезентацией эксперта, под которой он понимал, что пси­
хологические процессы эксперта не включают вычисление явного или суще­
ственного среднего значения входных переменных, но что оно может быть
имитировано подобным оцениванием. Параморфические репрезентации были
край н е успеш ны м и (для обзора, см. Dawes & C o rrigan 1974, Slovic &
L ichtenstein, 1971) в контекстах, в которых предсказывающие переменные
имеют условные монотонные отношения к критериальным переменным.
Модели, вовлекающие предыдущее значение для расчета последующего,
используют весовые значения, полученные от экспертов, потому что эти зна­
чения не получены из соотношения между предсказывающими переменны­
ми и критерием. Все ж е эти параморфические репрезентации последователь­
но лучше функционируют, чем эксперты, от которых они были получены (по
крайней мере, когда оценивание качества осуществляется в терминах корре­
ляции между предсказанными и действительными переменными).
И спользование предыдущего значения для расчета последующего ока­
залось распространенным. Например, в исследовании, проведенном Виггин­
сом и Коухеном (W iggins & Kohen, 1971), аспирантам в психологии универ­
ситета ш тата Иллинойс предоставили 10 измерений способностей и инди­
видуальности, описываю щ их других (реальных) аспирантов по психологии
ш тата И ллинойс, и их попросили предсказать средние оценки в аспиранту­
ре на первом году обучения. Линейные модели экспертов в университете
ш тата И ллинойс работали лучш е, чем сами эксперты , предсказы вая дей­
ствительные оценки. Этот результат был такж е получен в исследовании,
проведенном в сотрудничестве с Виггинсом, Грегори и Диллером (W iggins,
G regory & D iller, цитированное в Dawes & C orrigan, 1974). Л .Р . Голдберг
(L.R. G oldberg, 1970) продемонстрировали его для 26 из 29 экспертов в об­
ласти клинической психологии, предсказываю щ их психиатрический ди­
агноз невроза или психоза, исходя из данных М иннесотского М ногофактор­
ного Личностного Опросника (MMPI), а Даус обнаружил его в оценивании
претендентов на поступление в аспирантуру ш тат Орегон. Единственным
опубликованным исклю чением к успешному использованию предыдущего
значения для расчета последующего, о котором я знаю , было исследование,
проведенное Либби (Libby, 1976). Он просил 16 служ ащ их кредитного бюро
из относительно м аленьких банков (расположенных в Ш ампейн-Урбана,
И ллинойс, с активами от 3 до 56 миллионов долларов) и 27 служ ащ их кре­
454 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
дитного бюро крупны х банков (расположенных в Ф иладельфии, с актива­
ми от б миллиардов до 4.4 биллионов) оценить, какие 30 из 60 фирм обанк­
ротятся в течение 3-х лет после их финансового утверж дения. Служащ ие
запросили 5 финансовых коэффициентов, на которых они основывали свои
оценки (например, отнош ение настоящ их активов к общей стоимости иму­
щ ества). В среднем, служ ащ ие правильно оценили 44.4 предприятия (74% ),
к ак либо платежеспособные, либо будущих банкротов. Но в среднем, пара-
морф ические репрезентации служ ащ их смогли верно охарактеризовать
только 43.3 (72% ). Эта разница оказы вается статистически значимой, и
Либби сделал вывод, что это был пример ситуации, где не работало исполь­
зование предыдущ его значения для расчета последующего - возможно, по­
тому что его эксперты были хорошо подготовлены для определения высоко
надеж ного критерия. Голдберг, однако, заметил, что многие отнош ения
имели сильно ассиметричные распределения, и он пересмотрел данные Либ­
би, нормализуя отнош ения перед тем, к ак построить модели служ ащ их кре­
дитного бюро. Либби обнаруж ил, что 77% служ ащ их превосходили свои
параморфические репрезентации, но Голдберг, используя измененные пред­
сказы ваю щ ие переменны е, обнаруж ил противоположное: 72% моделей
превосходили оцениваю щ их, от которых они были п олучены .4
Почему работает использование предыдущего значения для расчета пос­
ледующего? Баумен (Bowman, 1963), Голберг (1970) и Даус (1971) считали,
что ее успех исходит из ф акта, что линейная модель извлекает основное со­
держ ание (в подразумеваемых значениях) от характеристик изменчивого
поведения (например, оценки, подверженные влиянию эффектов контек­
ста или внеш них переменных).
У веренность в эффективности использования предыдущего значения для
расчета последующего была основана на построении валидности линейной
модели эксперта с валидностью его оценок. Это только одно из двух возмож ­
ны х сравнений. Второе - это валидность линейной модели оценивающего
против валидности линейных моделей в общем; то есть продемонстрировать,
что использование предыдущего значения для расчета последующего фун­
кционирует, потому что линейная модель улавливает сущность валидной
экспертизы оценивающего, исклю чая ненадежность; необходимо продемон­
стрировать, что значения, полученные от анализа поведения эксперта, пре­
восходят значения, которые могли быть получены другими способами, н а­
пример, случайно. П оскольку и модель эксперта, и модель, полученная слу­
чайно, являю тся совершенно надежными, сравнение случайной модели с
моделью эксперта позволяет оценить основную линейную репрезентацию

4Необходимо отметить, что верные линейные модели функционировали лучше, чем служа­
щие либо их параморфичекие интерпретации. Используя ту же задачу, Бивер (Beaver, 1966)
и Дикон (Deacon, 1972) обнаружили, что линейные модели прогнозировали с точностью
приблизительно 78% при кросс-валидации. Но я не могу не подчеркнуть, что самая про­
стая ложная модель функционирует лучше всего. Отношение активов к пассивам верно оха­
рактеризовали 48 (80%) случаев, изученных Либби.
Устойчивая привлекательность ошибочных ... 455
оценивающего, или содержание. Если случайная модель функционирует
одинаково хорошо, эксперт не будет "следовать валидным принципам, но
следовать им недостаточно" (Dawes, 1971, с. 182), по крайней мере, не более
валидным признакам , чем любые другие, которые оценивают переменные
в правильном направлении.
Таблица 1 представляет 5 исследований, обобщенных Даусом и Коррига­
ном (Dawes & C orrigan, 1974), в которых сравниваю тся валидности (то есть
корреляции), полученные различны ми методами. В первом исследовании,
861 пациент заполнили MMPI в различны х психиатрических больницах,
позднее они были разделены на невротических и психотических на основе
более обширной информации. Данные MMPI состоят из 11 множеств, к аж ­
дое из которы х представляет степень, в которой респондент отвечает на воп­
рос способом, похожим на тот, которым отвечают пациенты , страдающие
явной формой патологии. С каждым пациентом связан набор из 11 множеств,
и проблема - это предсказать, будет ли дальнейш им диагнозом психоз (обо­
значенный 1) или невроз (обозначенный 0). 29 клинических психологов "с
различны м опытом и образованием" (Goldberg, 1970, с.425) попросили сде­
лать этот прогноз по 11-этапному нормализованному распределению. Два
других исследования рассматриваю т 90 аспирантов первого года обучения
на психологическом отделении в университете ш тата И ллинойс, которые
были выдвинуты на основании 10 переменных, способных предсказать ака­
демический успех. Эти переменные вклю чали оценки теста на способности,
средние оценки в колледж е, отнесение к определенной категории (напри­
мер, экстраверсия) и различны е самооценки (например, добросовестность).
Д ля всех аспирантов были посчитаны средние годовые оценки на первом
году обучения. Задача состояла в том, чтобы спрогнозировать средние оцен­
ки, исходя из этих 10 переменных. Во втором исследовании этот прогноз
был выполнен 80 (другими) аспирантами в университете ш тата Иллинойс
(W iggins & Kohen, 1971), а в третьем исследовании этот прогноз был выпол­
нен 41 аспирантом в университете ш тата Орегон. Детали четвертого иссле­
дования уж е были обсуждены, оно рассматривает прогноз поздних оценок
способностей в Орегоне. В последнем исследовании (Y ntem a & Torgerson,
1961) экспериментаторы приписывали значения овалам, предложенным
испытуемым, на основе размера фигур, эксцентричности и насыщенности
серого цвета. Ф ормула, которая использовалась, была ij + kj + i k , где i,jvik
обозначают значения трех только что упомянутых измерений. Испытуемых
в этом эксперименте попросили оценить значения каж дого овала, и им пре­
доставляли обратную связь исхода в конце каждого испы тания. Задача со­
стояла в том, чтобы предсказать истинное (т.е. приписанное эксперимента­
тором) значение каж дого овала на основе его размера, эксцентричности и
насыщ енности по цвету.
456 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ

СО 05 Ob t-
TlJ со CO XO 05
© d d d d

CO b- X
XD XO CO
d d d d

о о X
со со °5
d d d d

м § *а
Нм
Таблица 1. Корреляции между значениями прогнозов и критерия

aä §>3 2 о tH fH 05
00 XD XO 00 X
IIМ d d d d d
§ «

rH о X XO о
co XO CSJ X
d d d d d

XSJ X
C 00 00 т05
Ч X
d d d d d

&
at
а
f i­

ll!
S> О Ф
и иО* ъ
о U
с
Й О О
X ЕН ЕН
Устойчивая привлекательность ошибочных ... 457
П ервая колонка Таблице 1 представляет среднюю валидность экспертов в
этих исследованиях, а вторая представляет среднюю валидность парамор-
фической модели этих экспертов. Во всех случаях использовалось преды­
дущее значение для расчета последующего. А затем идут случайные линей­
ные модели, созданные Корриганом и мною, модели, в которы х значения
выбирались наугад, за исключением знака, а затем применялись к стандар­
тизированным переменным.5
Знак каждой переменной был определен на предшествующей основе так, чтобы он имел
позитивное отношение к критерию. Затем из нормального распределения с единичной
дисперсией было выбрано наугад нормальное отклонение, и абсолютное значение этого
отклонения было использовано как вес перем енной. Д ля каж дого примера было
построено 10 тысяч таких моделей.(Daws & Corrigan, 1974, с. 102)

В среднем, эти случайные линейные модели работают почти так ж е хоро­


шо, к ак и параморфические модели экспертов. Эти средние значения пред­
сказаны в третьей колонке таблицы. Равновзвеш енные модели, представ­
ленны е в четвертой колонке, функционирую т даж е лучш е. (Существует
чисто математическое обоснование того, почему равновзвеш енные модели
работают лучш е.6) И, наконец, последние две колонки представляю т кросс-
валидизированную валидность стандартной регрессионной модели и валид­
ность оптимальной линейной модели.

5К сожалению, Daws и Corrigan не описали подробно, что эти переменные сначала должны
быть стандартизированы, и что результат - зависимая стандартизированная переменная.
Равное или случайное взвешивание несравнимых переменных - например, оценка ВЭ (Вы­
пускного Экзамена) (GRE) и средняя оценка (GPA), - без предварительной стандартизации
будет бессмысленным.
6 Рассмотрим набор стандартизированных переменных Х1? Х2, ... Хт, каждая из которых
положительно коррелирует со стандартизированной переменной Y. Корреляция среднего
значения X- Xmс Y равна корреляции суммы значений X с Y. Ковариация этой суммы с Y
равна:

) X * ( Xi l + X i2 ---+ x im)
И 1

'<7>£ v„

- г1+г2...+г т(сумма корреляций).

Дисперсия у равна 1, а дисперсия суммы значений X равно м + М(М-1) г \ где т - это сред­
нее значение внутренней корреляции между значениями X. Следовательно, корреляция
средних значений X с Y равна( 2^У (М + М(М-1) г ) ; это больше, чем ( 2л,)/(М + М2- М =
среднее г.. Так как каждая из случайных моделей позитивно коррелирует с критерием. Кор­
реляция среднего значения, которая является единично-взвешенной моделью, выше, чем
среднее значение корреляций.
458 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
В сущ ности, те ж е самые результаты были получены в процессе отбора
значения из прямоугольного распределения. Почему? Потому что линей­
ны е модели устойчивы к отклонениям из-за оптимального взвеш ивания.
Д ругими словами, вывод использования предыдущего значения при расче­
те последующ его, по крайней мере, в этих исследованиях, стал лиш ь под­
тверждением более раннего откры тия, что правильны е линейные модели
превосходят суж дения человека - веса, полученные от экспертов, настоль­
ко близки к оптимальным весам, что результаты моделей в высш ей степени
схож и. Одно из реш ений проблемы получения оптимального веса - в тер­
минах фон Винтерфельдта и Эдвардса (von W interfeldt и Edw ards, 1973)- со­
стоит в "категорическом максимуме”. Веса, близкие к оптимальному уров­
ню, приводят почти к такому ж е результату, что и оптимальное бета-значе­
ние. Так к ак эксперт знает, по крайней мере, хоть что-либо о направлении
переменны х, его суж дения порождают веса, близкие к оптимальному (од­
нако, важ но, что во всех случаях равное значение превосходит модели, ос­
нованные н а поведении оценивающего).
Н а тот ф акт, что различны е линейные формулы в высокой степени кор­
релирую т друг с другом, было впервые указано 40 лет назад Вилксом (W ilks,
1938). Он рассматривал только те ситуации, в которых наблюдалась пози­
тивная корреляция между предсказы ваю щ ими переменными. Такой ре­
зультат имеет силу обычно в тех случаях, когда эти внутренние корреля­
ции не являю тся негативными, например, корреляция между Х +2 Y и 2Х+Y
равна 0.80, когда X и Y - некоррелированные переменные. О тносительная
нечувствительность результатов к изменениям коэффициентов (при усло­
вии отсутствия изменений в знаке) совсем недавно исследовались Грином и
Вайнером, Вайнером и Тиссеном, В. Едвардсом, Гардинером и Эдвардсом
(G reen (1977), W ainer (1976), W ainer и Tissen (1976), W . Edw ards (1978),
G ardiner и Edw ards (1975)).
Даус и Корриган (Dawes и C orrigan, 1974, с. 105) заклю чили, что “весь
фокус в том, чтобы знать, каки е переменные рассматривать, а затем уметь
склады вать". Этот принцип отлично иллю стрирует нижеследующ ее иссле­
дование, проводенное с момента опубликования статьи Дауса и Корригана.
В нем Хеммонд и А лельман (Hammond и A delm an, 1976) к ак исследовали,
так и влияли на реш ение о том, какого типа пули следует использовать в
работе полицейским города Денвера, реш ение, имеющее гораздо более оче­
видное социальное значение, чем большинство обсуждаемых ранее. Ц итата
из Х еммонда и А днльмана (Hammond и A delm an, 1976):
В 1974 году отделение полиции города Денвера (ОПД), равно как и другие отделения
полиции по всей стране, решили сменить амуницию. Основной причиной, предъявлен­
ной полицией, было то, что официально принятые пули с закругленным концом обес­
печивали недостаточную "останавливающую эффективность" (то есть, возможность
лишить способности двигаться и, таким образом, препятствовать раненому открыть
ответный огонь по полицейскому и другим людям). По рекомендации начальника ОПД
Устойчивая привлекательность ошибочных ... 459
(а также других начальников полиции) официальные пули были заменены пулями с
полым наконечником. Такие пули, как утверждалось, выравнивают удар, таким обра­
зом, уменьшая степень проникновения, увеличивая останавливающую эффективность
и уменьшая потенциал рикошета. На предполагаемые изменения отреагировали Аме­
риканский Союз Гражданских Свобод, меньшинства и другие. Противники изменений
заявляли, что новые пули были не чем иным, как запрещенными законом пулями "дум-
дум" , что они приводят к гораздо более серьезным телесным повреждениям, чем пули с
круглым концом, и, следовательно, должны быть запрещены. Как обычно, мнения по
этому поводу формировались в частном порядке, а затем публично отстаивались с дол­
жным энтузиазмом и упорством, а также проводились обычные публичные слушания.
Обе стороны обращались к экспертам по баллистике за научной информацией и под­
держ кой (с. 392).

Дискутирую щ ие стороны фокусировали внимание на оценке достоинств


специфических пуль, смеш ивая их физическое воздействие и значение для
социальной политики; то есть, стороны просто выступали в защ иту той или
иной пули, не отделяя вопрос о том, каким целям долж на соответствовать
пуля (вопрос социальной политики), от вопроса о ее баллистических харак­
теристиках. Таким образом, к ак указы ваю т Хеммонд и Адельман, адепты
социальной политики, сами того не зам ечая, приняли роль (плохих) экс­
пертов по баллистике, и наоборот. Заслуга Хеммонда и А дельмана в том,
что они откры ли важ ны е политические измерения, основываясь на мнени­
ях деятелей политики, а затем получили экспертную оценку пуль с учетом
этих измерений. Оказалось, что этими измерениями были останавливаю ­
щ ая эффективность (вероятность того, что человек, получивш ий ранение
туловищ а, не сможет откры ть ответный огонь), возможность серьезных ра­
нений и возможность причинения вреда рядом стоящ им. Когда эксперты
по баллистике оценили пули с учетом этих измерений, то оказалось, что
последние два были почти полностью перепутаны, но они не были перепута­
ны с первым. По одному из измерений, смешивающему эффективность со
смертельностью, пули не различалась. Возможность серьезного ранения или
нанесения вреда рядом стоящ им в высокой степени связана с проникающ ей
способностью пули, тогда к ак возможность эффективно препятствовать от­
крытию ответного огня в высокой степени связана с ш ириной входящ его
ранения. Так к ак политические деятели не могли договориться о значени­
ях , приписанны х этим трем измерениям, Хеммонд и Адельман предложи­
ли наделить их равным значением. Комбинируя равное значение с (незави­
симыми) суж дениями экспертов по баллистике, Хеммонд и Адельман обна­
руж или пулю , которая "имеет большую останавливающ ую эффективность
и меньшую способность стать причиной повреж дения (и угрож ать рядом
стоящ им), чем стандартная пуля, используемая в то время ОПД" (Hammond
и A delm an, 1976, с. 395). Эта пуля такж е могла причинить вред в меньшей
степени, чем та, что была рекомендована ОПД ранее. Эта пуля была "при­
нята Городским Советом и всеми другими заинтересованными партиям и, и
сейчас н аходи тся в использовании ОПД" (H am m ond и A delm an, 1976,
460 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
с. 395).7 И снова, "весь фокус в том, чтобы реш ить, каки е переменные рас­
см атривать, а затем знать, к ак склады вать" (Daws и C orrigan, 1974, с. 105).
Так почему ж е люди не делают этого чащ е? Я знаю четы ре университета
(университеты ш татов И ллинойс, Нью-Йорк, Орегон, К алифорния, Санта-
Барбара - может быть и больше), которые используют линейную модель при
отборе претендентов, но даже они используют ее, к ак механизм начального
отсева и заменитель клинического суж дения при окончательном отборе для
тех, чьи оценки выш е критических. Статистическая формула Голдберга
(1965) для диагностики неврозов и психозов на основе данных MMPI дока­
зала свое превосходство над клиническим и специалистами, пытаю щ имися
реш ить ту ж е задачу (никто, насколько известно мне или Голдбергу, не на­
учил эксперта, который справлялся бы с этим лучш е), и лиш ь однажды я
п рекрати л использование ф ормулы (в госпитале У правления ветеранов
им . Энн Арбор (A nn A rbor V eteran A dm inistration H ospital)), ввиду очевид­
ны х ош ибок (интересная причина, обстоятельно обсуждавш аяся). В 1970
году я предлож ил, чтобы комитет наш его сообщества в Университете ш тата
Орегон распределил сокращ ения сообществ Ф онда национальной науки и
А кта о защ ите национального образования по отделам на основе квазили­
нейной точечной системы, базирую щ ейся на точно определенных индексах,
достоинствах отделения и его нуж дах; мне сказали: "Вы не можете систе­
матизировать человеческие суж дения". И только через ш есть месяцев пос­
ле того, к ак наш комитет осознал политическую и этическую невозможность
сокращ ения сообществ на основе интуитивны х суж дений, такая система
бы ла принята. И так далее.
В течение последних трех лет я писал и говорил о пользе (и, по-моему,
этическом превосходстве) использования линейны х моделей при принятии
социально важ ны х реш ений. Периодически у различны х отдельных чита­
телей и аудиторий возникало множество подобных возраж ений. Я хотел бы
закончить эту статью списком этих возраж ений и ответами на них.

В о зр а ж е н и я п р о ти в и с п о л ь зо в а н и я л и н е й н ы х м о д ел ей .
Эти возраж ения можно разделить на три обширных категории: техничес­
кие, психологические и этические. Мы обсудим каждую категорию .

Технические
Наиболее распространенное техническое возраж ение направлено против

7 Следует отметить, что было лишь восемь пуль на Г р а н и ц е П а р ет о ; то есть, было только
восемь пуль, не являющихся низшими по качеству, чем какая-либо другая, как в отноше­
нии останавливающей эффективности, так и в отношении возможности причинения вреда
(или низшими по одной из переменных и равными подругой). Следовательно, любое прави­
ло распределения значения выбрало бы одну пулю из этих восьми.
Устойчивая привлекательность ошибочных ... 461
использования коэф фициента корреляции; например, Римас и Д ж иник
(Rem us и Jenicke, 1978, с. 221) писали:
"Ясно, что выбор Даусом и Корриганом коэффициента корреляции для установления
полезности случайных и единичных правил является несоответствующим (несоответству­
ющим чему?). Также необходима функция критерия в экспериментах, цитируемых Да­
усом и Корриганом. Несомненно, что существует и функция цены неправильной класси­
фикации неврозов и психозов или отказа в поступлении в аспирантуру образованным
студентам, в то время как принимаются студенты с предельно низкими баллами."

Рассмотрим сначала проблему поступления в аспирантуру. Больш инство


учебных заведений имеют к мест и N претендентов. Проблема состоит в том,
чтобы вы брать наилучш их к (которых хотят принять в учебное заведение)
из количества N. Какой ж е способ здесь будет лучш им, чем соответствую­
щ ий разряд? Н икакой. Римас и Д ж иник пиш ут так, к ак если бы это была
проблема не сравнительного, а абсолютного выбора. Однако большинство
социальных выборов включаю т в себя отбор лучш их или наилучш их аль­
тернатив из набора имеющ ихся: студентов, которые будут успешнее; пуль,
которые окаж утся наилучш ими, более выгодное место для аэропорта и т. д.
Д ля оценки таких выборов коэффициент корреляции будет со всей очевид­
ностью подходящ им, так к ак он прекрасно отраж ает разряд.
Задача неврозов-психозов является более тонкой и поддерживает их до­
воды даж е в меньш ей степени. "Несомненно, -утверж даю т они, - здесь есть
ф ункция ц ены ", но они не определяют подробно ни одного из кандидатов.
Это и понятно: если они смогут это обнаружить, клинические суж дения ока­
ж утся превосходящ ими линейные модели. Почему? При отсутствии подоб­
ного вывода с их стороны довод сводится на "нет". Но этот довод из вакуума
может быть непреодолимым для людей (например, для проигрываю щ их
генералов и проигрывающ их футбольных тренеров, которые знаю т, что их
планы несомненно сработают, в то время как планы в действительности об­
речены на провал, что бы ни произош ло).
Другое связанное с этим техническое возраж ение касается сравнения
средних коэффициентов корреляции экспертов и линейны х моделей. Воз­
можно, усреднение делает неясными суж дения действительно выдаю щ их­
ся специалистов, но данные показы ваю т иное. Н апример, в исследовании
Голдберг (1970) только 5 из 29 обученных клинически психологов показали
лучш ие результаты , чем модель с равными весами, и ни один не превзош ел
правильную модель. В исследовании Виггинса и Коэна (1971) ни один из
специалистов не превзош ел модель с равными весами, и мы получили та­
кой ж е результат в Орегоне. В исследовании Либби только 9 из 43 специали­
стов превзош ли отношение активов и пассивов, прогнозируя банкротства
(3 справились на том ж е уровне). П ризнавая то, что клиницисты должны
уметь предсказать невротические и психотические диагнозы , что аспиран­
ты долж ны быть способны предсказать успешность вы пускны х экзаменов,
что банковские служащ ие отдела кредитов должны предвидеть банкротства,
462 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
то, возможно, эксперты , задействованные в исследованиях, были выбраны
неправильно. Снова этот довод возникает из вакуума: если бы были задей­
ствованы другие эксперты , то и результаты были бы другими. Но нет таких
экспертов, и опять-таки, соответствующим ответом будет вопрос, на каком
основании эти гипотетически другие люди должны быть какими-то други­
ми. (К ак сказал мне один вице-президент университета, “Ваше исследова­
ние только доказы вает то, что вы задействовали плохих специалистов; мы,
несомненно, мож ем показать лучш ие результаты , задействовав лучш их
специалистов” - очевидно, не с ф акультета психологии.)
И последнее техническое возражение касается природы критериальны х
переменных. Они, к ак признано, недолговечны и неглубоки (например, сред­
ние оценки, диагнозы); в противном случае большинство исследований было
бы невозможным. Тогда поднимается вопрос, были бы другими результа­
ты, если нуж но было бы предсказы вать точный важ ны й длительны й кри ­
терий. Ответ таков: результаты , конечно ж е, могли бы быть другими, но у
нас нет оснований предполагать, что они были бы другими. Во-первых, от­
даленное будущее обычно менее предсказуемо, чем непосредственное буду­
щ ее, по той постой причине, что на исходы деятельности индивида влияет
большее количество непредвиденных внеш них или внутренних факторов.
(Заметим, что мы не обсуждаем совокупные исходы, такие, к ак необычай­
но холодная зим а на Среднем Западе, продливш аяся три м есяца.) П осколь­
ку начинать с клинического предсказания хуж е, чем с линейного, то гипо­
теза будет иметь силу только в том случае, если линейное предсказание со
временем окаж ется намного хуж е, чем клиническое. Нет никакого основа­
ния, полагать, что произойдет это дифференциальное ухудш ение в предска­
зании, и ни об одном из них у меня никогда не возникало мысли. Опреде­
ленно, не сущ ествует никаких свидетельств. О пять-таки, возражение состо­
ит из довода, взятого из вакуума.
Особенно непреодолимым является ф акт, что лю ди, которые утверж да­
ют, что другие критерии, эксперты , переменные или временные рам ки мо­
гут привести к другим результатам, имели в своем распоряж ении 2 5 лет для
того, чтобы представить примеры, но они не смогли этого сделать.

П сихологические
Одно психологическое возражение против использования линейны х моде­
лей находится в наш ей избирательной пам яти о клиническом предсказа­
нии. Н аш а вера в такое предсказание подкрепляется доступностью (Tversky
& K ahnem an, 1974) примеров успешного клинического предсказания, - осо­
бенно тех, что являю тся исключением некоторой формулы: "Я однажды знал
человека с..., которы й..." (например, "Я знал об одном человеке с IQ равным
только 130, который получил высокую степень по психологии”. К ак пока­
зали Нисбетт, Боргида, Крендалл и Рид (N issbet, B orgida, C randall и Reed,
1976,7) такие единичные примеры часто имеют более сильное воздействие
Устойчивая привлекательность ошибочных ... 463
на суж дения, чем намного более достоверные статистические сведения, ос­
нованные на многочисленных примерах. Хорошей профилактикой для кли ­
нических психологов, основывающих возражение статистическому предска­
занию на таких примерах, было бы сохранение точных протоколов своих соб­
ственных предсказаний о своих собственных пациентах, - будущие протоко­
лы не попадают под прицел. Такие протоколы смогут сделать все примеры
успешного и неуспешного предсказания в равной степени доступными для
использования; в дополнение к этому, они могут быть полезны для другого
клинического исследования, в противовес статистическому, в смысле исполь­
зования к ак наилучшего эксперта - самого клинициста.
Более того, иллю зия хорошего суждения может быть усилена из-за отбора
(Einhorn & H ogart, 1978) в тех ситуациях, когда предсказание положитель­
ного или отрицательного исхода производит эффект самоисполнения. Напри­
мер, экзаменаторы, решившие, что кандидат хорошо подготовлен для выпус­
кной программы, могут чувствовать, что их суждение оправдано, если этот
кандидат успешен, даже хотя во многом успех кандидата является результа­
том положительного воздействия самой программы. (В противовес этому,
линейная модель отбора оценивается по тому, насколько хорошо она прогно­
зирует деятельность выбранных претендентов в пределах этой группы.) Или
официант, который полагает, что некоторые люди за столиком не платят хо­
рош их чаевы х, может быть менее внимателен, чем обычно, и получить мень­
ш ие чаевые, тем самым, оправдав свое клиническое суж дение.8
Второе психологическое возраж ение против использования линейны х
моделей основывается на их низкой "доказательной" валидности. Здесь су­
ществует имплицитный (как противоположный эксплицитному) аргумент
из вакуума, так как не предполагаются ни изменения в оценочных процеду­
рах, ни в экспертах, ни в критериях. Вернее, невысказанное предположение
состоит в том, что эти критерии психологической выгоды, в сущности, в вы­
сокой степени прогнозируемы. Таким образом, следует, что, если один метод
прогнозирования (линейная модель) не работает достаточно хорошо, другой
может работать лучш е (основательный вывод), что далее трансформируется
в убеждение, что тот, другой, способ будет работать лучш е (что не является
основательным выводом), - если однажды он был обнаружен. Это возраже­
ние наилучш им образом вы разил декан, рассматривавш ий принятие стар­
ш екурсников в аспирантуру, который написал: "Корреляция линейной ком­
бинации с будущим факультетским рейтингом составляет только 0.4, тогда
как корреляция суждений приемной комиссии - 0.2. Дважды ничего равня­
ется ничего". В 1976 году я ответил следующее (Dawes 1976, с.6-7):
В ответ я могу только отметить, что 16% изменений лучше, чем 4%. Для меня, однако,
очаровательной частью этого довода является подразумеваемое предположение, что
другие 84% изменений прогнозируемы, и мы можем их каким-то образом предсказать.

8Этот пример был приведен Einhorn (1979).


464 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
Так с чем же мы имеем дело? Мы имеем дело с личностью и интеллектуальными харак­
теристиками (одинаково сообразительных) людей, которым около 20 лет.... Почему мы
так убеждены, что этот прогноз может быть сделан вообще? Несомненно, не нужно чи­
тать Экклезиаста каждый вечер, чтобы понимать роль шанса.... Более того, есть оче­
видно положительные эффекты обратной связи в профессиональном развитии, кото­
рые преувеличивают пороговый феномен. Например, если однажды человека посчита­
ли достаточно "выдающимся", то его уже приглашают в выдающиеся учреждения, он
общается выдающимися коллегами, - и превосходство усиливается. С подобной про­
блемой сталкиваются и те, кто недостаточно богат для порогового уровня. Все эти фак­
торы не только ослабляют успешное длительное прогнозирование, но и исследования
успешности такого прогнозирования неизбежно ограничиваются до определенного кру­
га принятых исследований, с возложенными проблемами ограничения предела и с не­
гативной ковариантной структурой среди прогнозирующих факторов (Dawes, 1975).

Н аконец, на профессиональный успех могут влиять разнообразные не­


интеллектуальны е ф акторы , которые не могут быть оценены перед п риня­
тием в аспирантуру. Н апример, успешность формирования удовлетвори­
тельны х или вдохновляю щ их половых отнош ений, ещ е не очевидная гене­
тическая предрасположенность к наркотической или алкогольной зависи­
мости, несчастье присоединиться к исследовательской группе, которая лоп­
нет и т. д ., и т .п .
С интеллектуальной позиции, я нахож у в некоторой степени прим еча­
тельным то, что мы в силах прогнозировать даж е 16% изменений. Но я уве­
рен, что мой собственный эмоциональный ответ является показательны м
на фоне ответов моих коллег, которые лиш ь просто предполагаю т, что буду­
щ ее более прогнозируемо. Я хочу, чтобы оно было прогнозируемо, особенно
в тех случаях, когда аспект того, что я хочу прогнозировать, важен для
меня. Это ж елание, я полагаю , трансформирует само себя в подразумевае­
мое предположение о том, что будущее, в действительности, прогнозируемо
в высш ей степени, и за этим логически следует, что, если нечто не является
хорош им прогностическим элементом, что-нибудь другое мож ет оказаться
в этом плане лучш им (хотя неправильно будет утверж дать, что оно обяза­
тельно окаж ется).
С татистическое предсказание, так к а к оно вклю чает специф икацию
(обычно низкий коэффициент корреляции) того, как плохо мы можем пред­
сказы вать, резко пораж ает нас фактом, что ж изнь не является полностью
предсказуемой. Н есистематическое клиническое предсказание (или "пост­
ди кци я"), наоборот, предлагает нам утеш ительную иллю зию , что ж изнь в
действительности предсказуема, и мы ее можем предсказы вать.

Эт ические
Когда я был прош лым летом на Я рмарке Ренессанса в Лос-Анджелесе, я
случайно услы ш ал жалобы одной ж енщ ины , что она бы ла "ужасно неспра­
ведливо" отвергнута на психологическом ф акультете в Университете К али­
форнии, Санта-Барбара, на основании одних лиш ь цифр, даж е без интер­
Устойчивая привлекательность ошибочных ... 465
вью. "К ак они могут сказать, к ак ая я ? ” Ответ состоит в том, что они не мо­
гут. Равно к ак и с интервью (K elly, 1954). Тем не менее, многие люди при­
держиваю тся мнения, что делать реш ающ ий социальный выбор без интер­
вью негуманно. Я думаю, что вопрос о том, обращаются ли с людьми спра­
ведливо, более соответствует вопросу о том, были или нет с ними гуманны,
чем к вопросу о том, встречались ли с ними лично. (Некоторые из наихуд­
ш их докторов проводят большое количество времени в разговорах со свои­
ми пациентами, не читаю т медицинских журналов, делают мало или не де­
лаю т вовсе анализов и горюют на похоронах.) Средние оценки представляет
поведение претендента в течение 3,5 лет. (Конечно ж е, не все профессора
имеют предубеждение относительно особой формы креативности претенден­
та.) Балл вы пускны х экзаменов является более тщ ательно продуманной
проверкой. Н еужели мы действительно считаем, что мы справимся с этой
работой лучш е или справедливее 10-минутной оценкой документов из лич­
ного дела или получасовым интервью , чем могут сделать эти две простые
цифры? Такое когнитивное самомнение (Dawes, 1976, с. 7) неэтично, особен­
но учиты вая ф акт отсутствия очевидного доказательства того, что мы это
сделаем лучш е, чем линейное уравнение. (Но даж е исклю чения необходи­
мо делать с предельной осторожностью, если это должно быть этично; так
как если мы примем кого-нибудь с предельно низким и линейными показа­
телями на основании того, что у него или нее есть особый талант, мы автома­
тически откаж ем кому-то с более высокими оценками, кто с большой веро­
ятностью может иметь в равной степени впечатляю щ ий талант, если бы мы
принялись его оценивать.)
Не имеет значения, насколько сильно измененным мы хотим видеть тот
или иной аспект в том или ином исследовании, рассмотренном в этой ста­
тье. Не имеет значения, насколько психологически независимыми или не­
приятны м и мы находим их результаты . Не имеет значения, насколько эти­
чески неудобно мы себя чувствуем, "приравнивая людей к простым циф ­
рам ". Ф актом остается то, что наш и клиенты - это лю ди, заслуживаю щ ие
возможного наилучш его отнош ения. Если это означает, - к ак это происхо­
дит в настоящ ее время, - что отбор, диагностика и прогнозирование долж ­
ны основываться не более, чем на сумме чисел, представляю щ их оценки по
важ ны м характеристикам, то так оно и должно быть. Поступать иначе оз­
начает обманывать людей, которы м мы служ им.
29. Жизнеспособность мифических чисел*

Макс Зингер

Вообще предполагается, что за год в Нью-Йорке наркоманами, зависимы ­


ми от героина, разворовы вается имущ ества на сумму от 2 до 5 млрд, долла­
ров и соверш ается половина имущ ественных преступлений. Эти оценки
преступности среди нарком анов использую тся такой организацией к ак
RAND, таким политическим деятелем как Говард Самюэлс, и даж е Гене­
ральны м П рокурором Соединенных Ш татов. О ценка того, что половина
имущ ественны х преступлений соверш ается наркоманами, первоначально
приписывалась полицейским чиновникам, но использовалась так часто, что
стала частью общественного сознания.
Стоимость имущ ества, украденного наркоманами, обычно оценивается
следующ им образом:
Н асчиты вается 100.000 наркоманов, чей средний дневной расход на нар­
котики составляет $30. Это означает, что наркоманам необходимо где-то
$1,1 млрд, в год на покупку героина (100.000 х 365 х $30). Так к ак нарко­
ман долж ен продать краденую собственность только за четверть ее реаль­
ной стоимости, или даж е меньше, он должен украсть где-то от $4 до $ 5 млрд,
в год на покупку героина.
Эти вы числения могут быть выполнены с большей или меньш ей точнос­
тью. М ожно допустить, что те наркоманы , которые ведут незаконны й образ
ж и зни , проводят больше четверти своего времени в тюрьме, что уменьш ило
бы сумму преступлений н а четверть. (The New York Times недавно сообщал
о смерти В ильяма Рейли (по прозвищ у “Осел”). 74-летний бывш ий нарко­
м ан, бывш ий в зависимости в течение 54 лет, 30 из которых провел в тю рь­
ме.) Определенную часть того, что ворует наркоман, составляю т наличны е
деньги, которы е не являю тся материальным имуществом. Значительную

*Эта глава первоначально появилась в The Public Interest, 1971, 23,3-9. Авторское право
© 1971 у National Affairs, Inc. Печатается по разрешению.
Жизнеспособность мифических чисел 467
часть стоимости героина покрывает, скорее, участие в наркоторговле, чем
обкрадывание общества, а другая больш ая часть покрывается за счет про­
ституции, вклю чая мужчин-наркоманов, ж ивущ их за счет проституток. Но
независимо от того, насколько тщ ательно это рассматривать, если пы тать­
ся дать оценку собственности, украденной наркоманами, предположив, что
их 100.000, и оценив минимальную сумму, которую им необходимо будет
украсть, чтобы поддержать себя и свои привы чки (после оценивания закон­
ного дохода), то приходиш ь к цифре, соседствующей с $1млрд. в год для
Нью -Йорка.
Но что произойдет, если подойти к этому вопросу с другой стороны? Пред­
полож им, мы спраш иваем: “Какое количество собственности украдено -
наркоманами или кем-либо ещ е?” К раж наркоманов должно быть меньш е,
чем суммарное количество краж . К акова ценность собственности, украден­
ной в Нью-Йорке в год? Когда я спросил в первый раз, мне показалось не­
сколько удивительным, что на этот вопрос, к ак оказалось, достаточно труд­
но ответить, даж е приблизительно. Ни у кого нет оценок, в которы х они
имели бы хоть наименьшую уверенность, и вопрос, казалось, задавался не­
часто. Сумма официально заявленны х краж в Нью-Йорке составляет при­
близительно 300 млн. в год, из которы х около 100 млн. приходится на авто­
мобильные краж и (преступления, редко совершаемые наркоманами). Но
ясно, что о большом количестве краж не заявлено; например, обычно не за­
являю т в полицию о магазинны х краж ах. (Об огромных потерях собствен­
ности не сообщается такж е и в страховые компании, и страховая индустрия
не имеет истинной оценки суммарных краж .)
Однако оказы вается, что если кто-то просто задает вопрос типа: “Возмож­
но ли, что наркоманы украли собственности на $1 млрд, в прошлом году в
Н ью -Й орке?”, то относительно легко оценить, на какую сумму украдено
собственности. Ясно, что два больш их компонента краж наркоманов - это
магазинны е краж и и краж и со взломом. К акова может быть ценность соб­
ственности, украденной наркоманами в магазинах? Вся розничная торгов­
л я в Нью-Йорке составляет порядка $15 млрд, в год. Сюда входят автомо­
били, ковры , бриллиантовые кольца и другие изделия, недоступные для м а­
газинны х воров. Разум ная потеря имущ ества в учреж дениях розничной
торговли составляет 2% . Сюда входят растраты руководства, краж и клер­
ков, в транспортно-погрузочном отделе, водителей и т.д. (Универмаги, в
частности, сообщают о большом увеличении магазинны х краж в последние
годы, но они находятся в числе наиболее уязвимы х учреждений розничной
продаж и и не так сущ ественны, чтобы намного увеличить общую норму в
2% .) Общепринято, что существенно больше, чем половина собственности,
исчезнувш ей из учреждений розничной торговли, выносится сотрудника­
м и, а остаток - магазинными ворами со стороны. Но давайте припиш ем им
1% всей украденной собственности, продававш ейся в розницу в Нью-Йор­
ке, - это будет $150 млн. в год.
468 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
А как ж е насчет краж и со взломом? В Нью-Йорке где-то 2,5 млн. домашних
хозяйств. Предположим, в среднем 1 из 5 домов подвергается грабежу или кра­
ж е со взломом каждый год. Здесь учитывается, что в некоторых районах краж и
со взломом являются обычным явлением, и что некоторые дома подвергаются
краж е со взломом даже более 1 раза в год. Средняя ценность собственности, вы­
носимой при краж е со взломом, может быть порядка $200. При некоторых кра­
ж ах со взломом, конечно ж е, выносится гораздо больше собственности, но такие
ценные краж и совершаются намного реже и часто профессиональными ворами,
не являющ имися наркоманами. Если мы используем цифры $200 х 500.000
краж , мы получим, что за год в Нью-Йорке из домов людей совершаются кражи
имущества на сумму $100 млн.
Очевидно, ни одно из этих оцененных значений не является ни несомненным,
ни достаточно обоснованным. Вы можете сделать собственную оценку. Оценки
здесь носят такой характер, что было бы очень удивительно, если бы они ошиба­
лись в 10 раз, и не очень важно для заключения, если бы они ошибались в 2 раза.
( Это хорошая позиция, в которой может находиться оценивающий.)
Очевидно, что не все краж и наркоманов - это собственность, взятая из
магазинов и домов. Наиболее ужасаю щ ие типы преступлений, соверш ае­
мые наркоманами - это краж и собственности при разбойном, хулиганском
нападении на ж ителей Нью-Йорка. И мы можем их оценить. Предположим,
что в среднем каж ды й год один человек из десяти подвергается разбойному
или хулиганскому нападению с краж ей собственности. Это будет 800.000
таких нападений, и если в среднем человек отдает $ 100 (что маловероятно),
в такой форме к раж ежегодно изы мается $8 млн.
Таким образом, мы видим, что, если приписать наркоманам все м агазин­
ные краж и , все краж и в домах, все краж и у отдельных людей, общ ая сто­
имость собственности, украденной наркоманами в Нью-Йорке, составляет
где-то $330 млн. загод. Можно перебросить сюда все “поправочные м нож и­
тели”, каки е пож елаеш ь, прибавить все другие разнообразные преступле­
н и я, соверш аемые наркоманами, но что бы ни было сделано, трудно найти
основания для той оценки, что наркоманы воруют более половины м илли­
арда в год, а четверть миллиарда вы глядит более правдоподобной оценкой,
хотя и, возможно, по максимуму. В конце концов, есть ж е воры, не являю ­
щ иеся наркоманами.
Таким образом, я уверен, мы показали, что, несмотря на общепринятое
предположение о том, что наркоманы в Нью-Йорке воруют от $2 до $ 5 млрд,
в год, реальная цифра в десять раз меньше, и что это можно продемонстриро­
вать пятью минутами размыш лений. *Так что ж е? Даже на сумму в четверть
миллиарда - это все ж е много собственности. Эта цифра превышает суммы,

1 Мифические числа могут быть более мифическими и иметь большую жизнеспособность в


области преступлений, чем в большинстве других. В начале 50х годов Kefauver Committee
опубликовало оценку годового “изъятия” в азартных играх в США в $20 млрд. Цифра в
“действительности была взята с неба”. Один из сотрудников сказал: “Мы не имели ни ма­
лейшего представления о потраченных деньгах. Калифорнийская Комиссия по Преступле-
Жизнеспособность мифических чисел 469
тратящ иеся ежегодно на реабилитацию наркоманов и на другие программы,
направленные на предотвращение и контроль наркомании. Кроме того, цен­
ность собственности, украденной наркоманами, это м алая часть той цены,
которую платит общество за воровство наркоманов. Намного больш ая цена -
это страх, измененная атмосфера соседства, вынужденная предосторожность
и другие побочные реакции на воровство и его опасность.
Один из моментов в попытке оценить стоимость собственности, украден­
ной наркоманами, состоит в том, чтобы пролить свет на отношение людей к
цифрам. Люди чувствуют, что наркоманами соверш ается множество пре­
ступлений, и что $2 млрд. - это больш ая циф ра, таким образом, они склон­
ны верить, что краж и наркоманов составляют $2 млрд, в год. Но $250 млн. -
это тоже больш ая цифра, и если бы наш е ощущ ение перспективы не было
бы искаж ено ежедневным осознанием федеральных расходов, большинство
вполне довольствовалось бы принятием того ф акта, что $250 млн. в год -
это больш ая сумма краж .
В продолжение нити рассуждений, эта попытка оценки является еще од­
ним напоминанием, что даже ответственные должностные лица, ответствен­
ные газеты и ответственные исследовательские группы подбирают и переда­
ют к ак сплетни цифры, которые в действительности не имеют реального ос­
нования. Этот опыт напоминает нам, что только потому, что оценка широко
использовалась различными людьми, которые должны знать, о чем они гово­
рят, нельзя предполагать, что она является даже приблизительно верной.
Тот ф акт, что наркоманами не мож ет соверш аться так много краж , как в
том уверены лю ди, подразумевает ещ е более важ ны й момент, а именно: не
может быть и такого количества наркоманов, как многие полагают. Боль­
ш ая часть денег в уплату за героин в розницу идет за счет воровства, и боль­
шинство наркоманов покупают героин в розницу. Таким образом, количе­
ство наркоманов, в основном, - хотя и не точно, - ограничено суммой краж .
(По оценке, полученной в исследовании Гудзоновского института (H udson
In stitu te ), около половины объема героина потребляется лю дьми, участву­
ющими в системе его распространения, которые не покупают его в розницу
и не платят за него за счет украденной собственности, а только за счет своих
“услуг” в этой системе распространения.2) Но, несмотря на то, что люди,
участвующие в этом бизнесе (на более низких уровнях), потребляют около
половины героина, они составляю т всего лиш ь 1 /6 или 1/7 от всего количе­
ства наркоманов. Они могут позволить себе дорогие привы чки.

ниям сказала — $12 млрд., Вирджил Петерсон из Чикаго сказал — $30 млрд. Мы выбрали
$20 млрд, как баланс между этими двумя.
Необычный пример мифических чисел, имевший огромную силу, — утверждение, что по­
лицией было застрелено 28 Черных Пантер, - подробно описывался Эдвардом Джеем Эп­
штейном в газете The New Yorker от 13 февраля, 1971 года. (Оказалось, что было убито 19
Пантер, 10 — полицией, из которых 8 — в ситуациях, когда Пантеры, вероятно, были ак­
тивны).
2Параллельные данные были получены в более позднем исследовании в Больнице Св. Луки
81 наркомана — средний возраст 34 года. Больше половины героина, потребляемого этими
470 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
Наиболее популярная, неофициальная оценка количества наркоманов в
Нью -Йорке - 100.000 с плюсом (обычно с акцентом на “плюс”). Ф едераль­
ный реестр а Ваш ингтоне насчитывает 30.000 наркоманов в Нью-Йорке, а
реестр имен наркоманов Нью -йоркского департамента здоровья - 70.000.
Н есмотря на то, что не все люди в этих списках все еще являю тся активны ­
ми наркоманами, - многие из них умерли или в тюрьме, - большинство по­
лагает, что многие наркоманы вообще не попали ни в один из этих спис­
ков. Обычно оценку, что в Нью-Йорке 100.000 наркоманов, считаю т очень
консервативной. В начале 1970 года ш ироко цитировали оценку доктора
Д ж удиан Денсен-Джербер (D r. Judiarm e D ensen-G erber), что к концу лета
будетболее 100.000подростков-наркоманов. Очевидно, однако, что есть еще
и наркоманы старш е 20 лет.* 3
Обсуждая в этой статье вопрос количества наркоманов, мы будем гово­
рить о таком человеке, о котором думаешь, когда употребляешь термин “нар­
ком ан”.4 Лучш им термином, возможно, будет “уличны й наркоман”. Это
человек, обычно употребляющий героин каж ды й день. Это такой человек,
которы й вы глядит и действует согласно обычному образу наркомана. Мы
исклю чаем здесь представителей медицинской профессии, которые часто
использую т героин и другие наркотики или пристрастились к ним, студен­
тов, употребляю щ их героин от случая к случаю, состоятельных людей, хотя
и зависимых, но которым не нужно воровать и часто посещать обычные при­
тоны наркоманов, и т.д. Когда мы обращаемся к “проблеме наркомании”,
гораздо менее важ но вклю чать эти случаи; несмотря на то, что они все ж е яв­
ляю тся проблемами в той или иной степени, однако проблемами совершенно
другого типа, чем та, что поставлена типичным уличным наркоманом.

наркоманами за год, было оплачено его продажей. Между прочим, в среднем каждый из
этих наркоманов украл за предыдущий год собственности на $9.000.
3 Среди последних исследований, пытающихся дать оценку, мы можем отметить марксис­
та Sol Yurick, давшего нам “500.000 отбросов” (Monthly Review, декабрь, 1970), и William
R. Corson , который утверждал в Penthouse за декабрь 1970 года, что “сегодня по меньшей
мере 2. 500.000 черных американцев посажено на героин”.
4 Существует интересная аномалия, касающаяся слова “наркоман”. Большинство людей,
если бы их попросили дать определение слову “наркоман”, сказали бы, что это человек, ко­
торый регулярно принимает героин (или подобный наркотик), и у которого, если не удается
достать обычную дозу героина, будут наблюдаться неприятные и болезненные ответные
симптомы. Но это определение не будет применимо к большей части тех, кого обычно при­
знают как “совокупность наркоманов”. В действительности, оно не будет применимо к боль­
шинству настоящих наркоманов. Наркоман, которого очистили от токсинов, или который
находился в тюрьме и был огражден от наркотиков в течение недели или около того, не
соответствует обычному определению “наркомана”. У него уже нет физических симптомов
в результате воздержания от героина. “Осел” Рейли (“Donkey” Reilly), конечно же, отвечает
понятиям большинства людей о наркоманах, но в течение 30 лет из 54, когда он был “нар­
команом”, он находился в тюрьме и, конечно же, не был активно зависим от героина боль­
шую часть времени, поведенного там, что составляет больше половины его карьеры “нарко­
мана” (хотя определенное количество наркотиков доступно и в тюрьме).
Жизнеспособность мифических чисел 471
По количеству собственности, украденной наркоманами, можно полагать,
что в Нью-Йорке их скорее 70.000, чем 100.000, и почти наверняка не может
быть 200.000, как иногда утверждают. Некоторые другие простые способы
оценки количества уличных наркоманов приводят к подобным результатам.
И сследователи, имеющие дело с совокупностью наркоманов, приш ли к
оценке, что средний уличный наркоман проводит от 1/4 до 1/3 своей ж изни
в тюрьме. (Некоторые из тех, кто изучает эту тему, такие к ак Edw ard Preble
и Jo h n J . Casey, J r ., полагают, что в среднем более 40% .) Это подразумева­
ет, что в любое время от 1/4 до 1/3 всех наркоманов находятся в тюрьме, и
что общее число наркоманов может быть оценено при умножении количе­
ства наркоманов в тюрьмах на 3 или 4. Конечно ж е, количество наркоманов
в тюрьме не является известной величиной (и, в действительности, к ак мы
указы вали выш е, даж е не совсем точно отвечает понятию). Однако можно
все ж е сделать приемлемую оценку количества наркоманов в тюрьме (и для
этой цели мы можем задействовать наркоманов в различны х учреж дениях
принудительного лечения). Это количество приблизительно равно 14.000 -
17.000, что вполне совместимо с оценкой количества уличны х наркоманов
в Н ью -Й орке, составляющ ей 70.000.
Другим способом оценки общего количества уличны х наркоманов в Нью-
Йорке является использование имеющ ейся демографической информации
о совокупности наркоманов. Н апример, мы можем небезосновательно быть
уверенными в том, что где-то 25% уличны х наркоманов в Нью-Йорке - это
пуэрториканцы , а где-то 50% - афро-американцы. Мы знаем, что прибли­
зительно 5 из б уличны х наркоманов - это муж чины , и что 50% попадают в
возрастную категорию от 16 до 25 лет. Это будет означать, что 20% общего
количества уличны х наркоманов - это чернокож ие муж чины в возрасте от
16 до 25 лет. Если наркоманов 70.000, то это будет означать, что 14.000 афро­
американцев в возрасте от 16 до 25 лет являю тся наркоманами. Но всего в
городе около 140.000 афро-американцев в возрасте от 16 до 25 л ет-в о зм о ж ­
но, половина из них ж ивет в бедных районах. Это означает, что если в горо­
де 70.000 наркоманов, то 1 из 10 молодых афро-американцев - наркоман,
если 100.000 наркоманов - то 1 из 6, если 200.000 - то 1 из 3. Вы можете
реш ить сами, к ак ая из степеней охвата группы молодых муж чин афро-аме­
риканцев более вероятна, но понятно, что 200.000 наркоманов - неправдо­
подобное количество. Подобным образом, количество уличны х наркоманов
70.000 будет подразумевать, что 7.000 молодых пуэрториканцев-муж чин -
наркоманы , а общее количество пуэрториканских парней в возрасте от 16
до 25 лет в Нью-Йорке - около 70.000.
Ни одно из выш еперечисленных вычислений ни в коем случае не пы та­
ется свести н а “нет” значение проблемы героиновой зависимости. Героин
это уж асное проклятие. Когда думаеш ь об индивидуальной трагедии, то
70.000 - это ужасающ е большое количество наркоманов. И если тебе необ­
ходимо зарабаты вать на ж изнь, то $250 млн - это ужасаю щ е огромные день­
ги, которы е воруют у граж дан города с тем, чтобы, пройдя через руки нар­
команов и торговлю крадены м, они осели в карманах тех, кто ввозит и рас­
пространяет героин, и тех, кто берет взятки и оказы вает другие услуги для
героиновой индустрии.
Главным моментом этой статьи может быть иллю страция того, к ак дале­
ко можно зайти в рассмотрении проблемы, серьезно относясь к цифрам, к
тому, что они подразумевают, проверяя различные выводы друг относитель­
но друга и относительно общей информации (такой к ак количество людей
или домов в городе). Н езначительны е усилия в этом направлении могут
иметь большое значение для помощи обычным людям и должностным ли ­
цам в том, чтобы справиться с различного рода экспертами.
30. Интуитивное прогнозирование: предубеждения
и корректирующие процедуры*

Д а н и е л ь К а н е м а н и А м о с Т вер с к и

П р ед и сл о в и е
Лю бая значительная деятельность по прогнозированию вклю чает весомый
компонент суж дений, интуиции и развитой догадки. В самом деле, мнения
экспертов являю тся источником многих технологических, политических и
социальных прогнозов. М нения и интуиция играю т важную роль даже там,
где прогнозы получают в результате использования математических моде­
лей или имитации. И нтуитивные суж дения использую тся при выборе пе­
ременны х, рассматриваемых в таких моделях, приписанных им факторов
влияния, а такж е их предполагаемых начальны х значений. К ритическая
роль интуиции в прогнозировании любого рода требует анализа факторов,
которые ограничиваю т точность экспертны х суждений, а такж е разработ­
ки процедур, направленных на улучш ение качества этих суждений...

Е д и н и ч н ы е сл у ч аи и д а н н ы е р а с п р е д е л е н и я
От экспертов часто требуют предоставления наи лучш их догадок, оценок или
прогнозов, касаю щ ихся неопределенных величин, таких к ак индекс Доу-
Д ж онса в определенный день, будущие продаж и продукта или результаты
выборов. Следует различать два типа информации, имеющ ейся в распоря­
ж ении прогностика: данные случая и данные распределения. Единичная
инф ормация или данные случая, состоит из очевидных свидетельств по ча­
стному рассматриваемому случаю. Данные распределения, или данные ба­
зового значения, остоят из знаний о распределении исходов в подобных си­

* Эта глава является сокращенным вариантом статьи, которая появилась в редакции


S. Makridakis и S.C. Wheelwright, “Forecasting”,TIMS, StudiesinManagementScience, 1979,
12, 313-327. Авторские права © 1979 у North-Holland Publishing Со. Печатается в соответ­
ствии с разрешением.
474 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
туациях. Н апример, при прогнозировании продаж нового романа то, что
известно об авторе, стиле и сю жете, является единичной информацией, тог­
да к ак то, что известно о продаж ах романов, является данными распределе­
ния. Таким ж е образом, при прогнозировании долголетия пациента единич­
н ая информация вклю чает его возраст, состояние здоровья и прош лые ис­
тории болезни, тогда к ак данные распределения состоят в соответствующей
статистике населения. Единичная инф орм ация описывает характерны е
черты проблемы, которые отличают ее от других, тогда как информация
распределения характеризует исходы, наблю давш иеся в случаях подобно­
го рода. Современное понятие информации распределения не совпадает с
понятием распределения предш ествую щ ей вероятности Байеса. П ервая
определяется природой данны х, тогда к ак последняя определена в терми­
нах последовательности приобретения информации.
М ногие проблемы прогнозирования уникальны в том смысле, что в н а­
личии имеется очень мало, если есть вообще, релевантной информации.
П римерами могут быть прогноз спроса ядерной энергии в 2000 году, или
прогноз того, когда будут изобретены эффективные лекарства от лейкемии.
В таких проблемах эксперт должен полагаться исклю чительно на единич­
ную информацию . Однако действительность показы вает, что люди недоста­
точно чувствительны к данным распределения, даж е если она имеется в
наличии. В самом деле, недавнее исследование показало, что люди полага­
ю тся преимущ ественно на единичную информацию, даж е если она скудна
и ненадеж на, и приписываю т недостаточный вес данным распределения
(K ahnem an & Tversky, 1973,4; Tversky & K ahnem an,10).
В контексте планирования есть очень много примеров, в которы х игно­
рировалось распределение исходов предыдущего опыта. Ученые и писате­
ли, к ак известно, склонны недооценивать время, необходимое для завер­
ш ения проекта, даж е если у них есть значительны й опыт прош лых неудач­
ны х попы ток работать согласно планируемому графику. Подобная склон­
ность бы ла задокументирована в оценке инженерами времени, необходи­
мого для заверш ения ремонта электростанции (K idd, 1970). Х отя эта ошиб­
к а планирования относится к мотивационным ф акторам, таким к ак при­
нятие ж елаемого за действительное, очень часто она допускается даж е тог­
да, когда недооценка длительности или стоимости является наказуемой.
Ош ибка планирования является следствием тенденции пренебрегать рас­
пределительной информацией и принимать то, что можно определить как
внутренний подход к прогнозированию , при котором сосредотачиваются
скорее на составляю щ их специфической проблемы, чем на распределении
исходов в подобных случаях. Внутренний подход к оценке планов с боль­
шой вероятностью приведет к недооценке. Строительство здания может быть
заверш ено в сроки, например, если не будет задерж ек в доставке материа­
лов, забастовок, необычных погодных условий и т.п. Х отя все эти помехи
маловероятны , возможность того, что хотя бы одна из них мож ет произой­
ти, сущ ественна. Такое комбинаторное соображение, однако, неадекватно
Интуитивное прогнозирование... 475
представлено в интуиции людей (B ar-H illel, 1973). П опытки побороть эту
ош ибку путем прибавления ф актора погрешности редко являю тся адекват­
ными, поскольку отрегулированное значение слиш ком близко к начально­
му значению , так что действует, к а к закреп и тель (anchor) (T versky &
K ahnem an, 1974,1). П ринятие внеш него подхода, который рассматривает
специфическую проблему как одну из многих, может помочь преодолеть эту
склонность. При таком подходе не надо пы таться предсказать особый образ
действий, при котором план может потерпеть неудачу. Скорее, необходимо
соотнести насущную проблему с распределением сроков вы полнения для
подобных проектов. Полагаю т, что вероятнее получить соответствующую
оценку, задавая внеш ний вопрос: К ак долго обычно длятся такие проекты?
А не просто внутренний вопрос: Каковы специфические факторы и трудно­
сти в рам ках специфической проблемы?
Тенденция пренебрегать данными распределения и полагаться главным
образом на единичную информацию усиливается любым фактором, увели­
чиваю щ им ощущаемую уникальность проблемы. Релевантность данны х
распределения может быть скры та подробным ознакомлением со специфи­
ческим случаем или сильной вовлеченностью в него. Н а каж ущ ую ся уни­
кальность проблемы такж е влияет и формулировка вопроса, ответ на кото­
рый должен дать эксперт. Н апример, вопрос о том, сколько будет стоить
разработка нового продукта, можно реш ить, используя внутренний подход,
при котором общ ая стоимость будет разбита на компоненты. Эквивалент­
ный вопрос о процентном превыш ении стоимости над текущ им бюджетом,
вероятно, заставит принять во внимание распределение превыш ения сто­
имости для разработок подобного рода. Таким образом, смена единицы и з­
мерения, - например, стоимости на превыш ение, - может изменить способ
рассмотрения проблемы.
П ревалирую щ ая тенденция недооценивать или игнорировать данные
распределения, возможно, является основной ошибкой интуитивного про­
гнозирования. П ринятие во внимание данных распределения, конечно ж е,
не гарантирует точности прогнозов. Однако обеспечивает некоторую защ и­
ту от соверш енно нереалистичного прогнозирования. А налитику, таким
образом, следует предпринимать все попы тки, чтобы сформулировать про­
гностическую проблему с целью облегчения использования данны х распре­
деления, доступной эксперту.

Р е гр е с с и я и и н ту и ти в н о е п р о гн о зи р о в а н и е
В больш инстве прогностических проблем эксперт имеет к ак единичную
информацию о специфическом случае, так и данные распределения об исхо­
дах в подобных случаях. Примерами могут быть консультант, прогнозирую­
щ ий вероятные достижения студента, банкир, оценивающий потенциальную
прибыль малого бизнеса, издатель, оценивающий продажу учебника, или эко­
номист, прогнозирующий некоторый индекс экономического роста.
476 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
К ак люди прогнозируют в таких ситуациях? Психологическое исследо­
вание полагает, что интуитивное прогнозирование генерируется согласно
простому правилу сопоставления (m atching): прогнозируемое значение вы ­
бирается таким образом, чтобы положение случая в распределении исходов
соответствовало его положению в распределении впечатлений (K ahnem an
& Tversky, 1973,4; Ross, 1977). Следующий пример иллю стрирует это пра­
вило. Редактор просмотрел рукопись романа и был приятно удивлен. Он ска­
зал: “Эта книга читается к ак бестселлер. Среди книг такого типа, издавае­
мы х за последние годы, я бы сказал, только 1 из 20 оказала на м еня большее
впечатление”. Если бы редактора попросили оценить продаж у романа, он
бы, возможно, предсказал, что она будет на уровне первых пяти процентов
распределения продаж.
Имеются значительны е свидетельства того, что люди часто прогнозиру­
ют путем сопоставления прогноза и впечатления. Однако это правило про­
гнозирования необоснованно, так к ак оно не может принимать во внимание
неопределенность. Редактор из наш его примера, несомненно, отметил бы,
что продаж а книг в высш ей степени непредсказуема. В подобной ситуации
с высокой неопределенность наилучш ий прогноз продажи книг должен бы
находиться где-то между значением, соответствующим чьему-то впечатле­
нию , и средним значением продаж книг подобного типа.
Один из основных принципов статистического прогнозирования, кото­
ры й такж е является одним из наименее интуитивны х, состоит в том, что
предельность прогнозирования необходимо сдерж ивать рассмотрением
предсказуемости. Представьте, например, что издатель знает из прошлого
опы та, что продаж а книг совсем не связана с его начальны ми впечатления­
ми. Рукописи, которые произвели на него благоприятное впечатление, и те,
которы е ему не понравились, в равной степени могли бы продаваться к ак
хорошо, так и плохо. В таком случае нулевой прогностичности наилучш ая
догадка издателя - это одинаковая продаж а всех книг, например, среднее
значение соответствующей категории, независимо от его личного впечатле­
н ия об одной из книг. Позволительно сопоставлять прогнозирование и впе­
чатление только в случаях совершенной прогнозируемости. В промежуточ­
ны х ситуациях, которые, конечно ж е, наиболее часты , прогнозирование
должно быть регрессивным; то есть, оно должно быть меж ду средним зна­
чением по классу и значением, наилучш им образом представляю щ им чье-
либо впечатление в конкретном случае. Чем ниж е прогнозируемость, тем
ближ е долж ен быть прогноз к среднему значению по классу. Интуитивное
прогнозирование типично является не регрессивным: люди часто делают
предельный прогноз на основе информации, чья надежность и прогности­
ческая валидность заведомо низки...
Интуитивное прогнозирование... 477
К о р р ек ти р у ю щ а я п р о ц ед у р а д л я п р о гн о за
Чем руководствуется эксперт, чтобы надлеж ащ им образом осуществить
регрессивное прогнозирование? Что приводит его к использованию доступ­
ной ему единичной информации и данные распределения в соответствии с
принципами статистического прогнозирования? В этом разделе предлага­
ется пяти-ш аговая процедура, позволяю щ ая достичь этих целей.

Ш аг 1: Выбор референтного класса


Целью этой стадии является идентификация класса, к которому осмыслен­
но относится рассматриваемый случай, и для которого известно или может
быть оценено с разумной уверенностью распределение исходов.
При прогнозировании продаж книги или кассового сбора от фильма, на­
пример, выбор референтного класса является прямы м. Относительно лег­
ко, в таких случаях, определить подходящ ий класс книг или фильмов, для
которых известно распределение продаж или доход.
Существуют проблемы прогнозирования, - например, при прогнозе сто­
имости разработки нового продукта или времени, которое потребуется, что­
бы он выш ел на ры нок, - для которых очень трудно определить референт­
ный класс, так к ак многочисленные примеры различаю тся так, что их очень
трудно осмысленно сравнивать. Однако, к ак отмечалось ранее, эта пробле­
ма иногда преодолевается путем переопределения количества, которое дол­
жно быть спрогнозировано. П роекты по разработке в различны х техноло­
гических отраслях, например, легче сравнить по проценту превыш ения сто­
имости, чем по абсолютной стоимости. Прогнозирование стоимости обра­
щ ает внимание экспертов на уникальны е характеристики каж дого проек­
та. П рогнозирование превы ш ения стоимости, напротив, придает огромное
значение детерминантам реализма при планировании, что является общим
для многих различны х проектов. Следовательно, можно легче определить
референтный класс при последней формулировке, чем при первой.
Очень часто эксперт думает о нескольких классах, к которым может быть
отнесена проблема, и необходимо сделать выбор среди этих альтернатив. Н а­
пример, референтными классами для прогнозирования продаж книги могут
быть другие книги этого ж е автора, книги этой ж е тематики или книги того
же общего типа, такие как романы в твердых переплетах. Выбор референтно­
го класса часто вовлекает обмен между конфликтными критериями. Таким
образом, для наилучш ей оценки распределения исходов позволительны наи­
более содержательные классы, но они могут быть слиш ком гетерогенными,
для того чтобы позволить осмысленное сравнение с рассматриваемой книгой.
Класс книг того ж е автора, с одной стороны, может обеспечить наиболее есте­
ственную основу для сравнения, но рассматриваемая книга может со всей
вероятностью вы йти за пределы наблюдавшихся ранее результатов. В этом
примере наиболее подходящим будет класс книг той ж е тематики.
478 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
Ш аг 2: Оценка распределения для референтного класса
Д ля некоторых проблем, - например, продаж а книг, - в наличии имеются
статистические данные, касающ иеся распределения исходов. В других про­
блемах соответствующее распределение должно быть оценено на основе раз­
личны х источников информации. В частности, эксперт должен обеспечить
оценку среднего значения по классу, а так ж е некоторые дополнительные
оценки, отражаю щ ие предел изменчивости исходов. Образцы вопросов тако­
вы: сколько, в среднем, продано экземпляров книг такой категории? Какова
пропорция книг этого класса, проданных в количестве более 15.000 ш тук?
Многие проблемы прогнозирования характеризую тся отсутствием точ­
ны х релевантны х данны х. Это часто происходит при долгосрочном прогно­
зировании, когда релевантное распределение имеет отношение к исходам в
отдаленном будущем. Рассмотрим, например, попы тку предсказать долю
А нглии на мировом ры нке в частной городской транспортной системе в 2000
году. М ожет быть полезной переформулировка этой проблемы следующим
образом: “Каково вероятное распределение доли А нглии на мировом ры нке
в 2000 году в различны х областях передовых технологий? К аковы ож идае­
мые результаты по частному случаю с транспортной системой в сравнении с
другими технологиям и?” Заметим, что в этой проблеме неизвестно распре­
деление исходов. Однако требуемое распределение, вероятно, мож ет быть
оценено на основе распределения значений доли А нглии на мировом ры нке
по различны м технологиям в настоящ ее время, урегулированном оценива­
нием долгосрочной тенденции в изменяю щ емся положении А нглии на м и­
ровом ры нке.

Ш аг 3: И н т уи т и вн а я оценка
Одна часть информации, которой располагает эксперт о проблеме, получена
из распределения исходов в референтном классе. К тому ж е, у эксперта обыч­
но имеется значительное количество единичной информации о частном слу­
чае, которая отличает его от других членов класса. Теперь следует попросить
эксперта дать интуитивную оценку на основе этой единичной информации.
К ак было отмечено ранее, эта интуитивная оценка, вероятнее всего, будет
нерегрессивной. Цель двух следующих ш агов процедуры состоит в коррек­
тировке этого предубеждения и получении более адекватной оценки.

Ш аг 4: О ценивание прогнозируемости
Теперь эксперт долж ен оценить степень, в которой тип имею щ ейся по это­
му случаю информации позволяет точное прогнозирование исходов. В кон­
тексте линейного прогнозирования соответствующей мерой прогностично-
сти явл яется/), корреляция Пирсона между прогнозированием и результа­
тами. Там, где есть данные о прошлом прогнозировании и исходах, требуе­
Интуитивное прогнозирование... 479
мое значение можно получить из них. При отсутствии таких данных необ­
ходимо полагаться на субъективное оценивание прогнозируемости. Стати­
стически опытный эксперт сможет дать точную оценку р на основе своего
опыта. Когда статистический опыт отсутствует, аналитак должен прибег­
нуть к менее прямы м процедурам.
Одна из таких процедур требует сравнения прогнозируемое™ перемен­
ной, с которой он имеет дело, с прогнозируемостью других переменных.
Например, эксперт может быть совершенно уверен, что его способность про­
гнозировать продажу книг превосходит способность спортивных экспертов
прогнозировать распределение очков в футбольных матчах, но она не так
хороша, к ак способность синоптиков прогнозировать температуру на два
дня вперед. Искусный и старательный аналитак мог бы построить прибли­
зительную ш калу прогнозируемое™ , основанную на вычисленной корре­
ляции между прогнозированием и исходами для набора феноменов, пред­
сказуемость которых колеблется от высокой (например, температура) до
низкой (например, стоимость акций). Тогда анали так просил бы эксперта
определить местоположение прогнозируемое™ целевого количества на этой
ш кале, таким образом, давая численную оценкур.
А льтернативный метод оценивания прогнозируемости вклю чает вопро­
сы типа: Если бы вам необходимо было рассматривать два романа, которые
вы собираетесь опубликовать, к ак часто были бы вы правы в прогнозирова­
нии, который из них будет продан в большем количестве? Оценка порядко­
вой корреляции между прогнозированием и исходами в этом случае может
быть получена следующим образом: ес лир -э т о оцененная доля пар, в кото­
рых порядок исходов был правильно спрогнозирован, то г = 2рЛ дает ин­
декс точности прогноза, который ранж ируется от 0, когда прогнозирование
находится на уровне ш анса, до 1, когда прогнозирование является совер­
шенно точным. Во многих ситуациях г - может быть использована, к ак гру­
бое приближение к р .
Делать оценку прогнозируемости нелегко, и она долж на тщ ательно рас­
сматриваться. Эксперт может быть подвержен ош ибке ретроспективного
взгляда (Fischhoff, 1975), которая ведет к переоценке прогнозируемости
результатов. Эксперт такж е может быть подвержен предубеждению доступ­
ности (Tversky & K ahnem an, 1973,11) и может вспомнить, большей частью ,
удивительные или запоминаю щ иеся случаи, в которых сильные первона­
чальны е впечатления были подтверждены позднее.

Шаг 5: Коррекция инт уит ивной оценки


Чтобы исправить не регрессивность, интуитивную оценку следует отрегу­
лировать относительно среднего значения по референтному классу. Если
интуитивная оценка была не регрессивна, тогда при общих условиях рас­
стояние между интуитивной оценкой и средним значением по классу долж ­
но быть уменьш ено фактором р, гдер - коэффициент корреляции. Эта про­
480 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
цедура обеспечивает оценку количества, которое, надеемся, уменьш ит не
регрессивную ошибку.
Н апример, предположим, что интуитивное прогнозирование эксперта о
продаж ах данной книги равно 12. 000, и что, в среднем, книги такой кате­
гории продаю тся в количестве 4 .0 0 0 . Далее предположим, что эксперт уве­
рен, что он правильно присвоил парам рукописей ранг по будущим прода­
ж ам на уровне 80% сравнения. В таком случае г= 1 ,6 - 1 = 0,6, а регрессив­
н ая оценка продаж будет равна 4 .0 0 0 - 0,6(12.000 - 4 .0 0 0 ) = 8. 800.
Эффект такой коррекции будет существенным, если интуитивная оцен­
к а относительно предельна, а прогнозируемость средняя или низкая. Логи­
ческое обоснование вы числения должно быть подробно разъяснено экспер­
ту, который затем будет реш ать, придерж иваться ли своего первоначально­
го прогноза, принять ли вычисленную оценку или исправить свою оценку к
некоторому промежуточному значению.
П роцедура, которую мы рассмотрели, откры та для некоторых возраж е­
ний, которые со всей вероятностью могут возникнуть во взаимодействии
аналитика и эксперта. Во-первых, эксперт может подвергнуть сомнению
предположение, что его первоначальная интуитивная оценка была не рег­
рессивной. К счастью, это предположение можно проверить, попросив экс­
перта оценить (1)процент случаев в референтном классе, - например, руко­
писей, - которые произведут на него более сильное впечатление; и (2) про­
цент случаев в референтном классе, в которых исходы превосходят его и н­
туитивное прогнозирование, - например, процент книг, проданных более чем
12. 000 экзем плярам и. Если два этих показателя приблизительно одинако­
вы , прогнозирование было, несомненно, не регрессивным.
Более общее возражение мож ет ставить под сомнение основную идею о
том, что прогнозирование должно быть регрессивным. Эксперт мог бы обра­
тить внимание, корректно, что данная процедура будет обычно выдавать
консервативны е прогнозы, не далекие от среднего значения по классу, и
очень маловероятно, что она предскаж ет исклю чительный исход, который
находится за пределами всех наблю давш ихся ранее значений. Ответ на это
возраж ение состоит в том, что ошибочный предсказываю щ ий фактор мо­
ж ет оставлять ш анс для точного предсказания нескольких исклю читель­
ны х исходов только за счет ошибочного определения многих других случа­
ев к ак исклю чительны х. Не регрессивное прогнозирование чрезмерно: оно
связано с сущ ественной вероятностью, что любое прогнозирование высокой
степени - это переоценка, а любое прогнозирование низкой степени - это
недооценка. В большинстве случаев это предубеждение весомо и должно
быть устранено....

З а к л ю ч и т е л ь н ы е за м е ч а н и я
П редставленный здесь подход основан на следующ их общих понятиях о
прогнозировании. Во-первых, что больш ая часть предсказаний и прогнозов
Интуитивное прогнозирование... 481
содержит несократимый интуитивны й компонент. Во-вторых, что интуи­
тивное прогнозирование знаю щ их людей содержит много полезной инфор­
мации. В-третьих, что такие интуитивны е суж дения часто являю тся пре­
дубежденными предсказуемым способом. Таким образом, проблема состо­
ит не в том, принимать ли интуитивное прогнозирование по внеш нему зна­
чению или отвергать его, а скорее как его можно освободить от предубежде­
ний и улучш ить.
А нализ суждений людей показы вает, что многие интуитивные предубеж­
дения вырастаю т из тенденции придавать малое значение определенным
типам информации, например, базовым частотам исходов и их предказуе-
мости. Стратегия освобождения от предубеждений, представленная в этой
статье, состоит в попытке получить от эксперта релевантную информацию ,
которой он обычно пренебрегал бы, и помочь ему интегрировать эту инфор­
мацию с его интуитивными впечатлениями таким образом, чтобы учесть
основные принципы статистического прогнозирования....
31. Освобождены« от предубеждения*

Барух Фишхофф

Р аз уж в некотором экспериментальном контексте был идентифицирован


поведенческий феномен, вполне уместно начать сомневаться в его устойчи­
вости. Распространенную и во многих случаях продуктивную стратегию
сомнения можно было бы назвать в честь сходной техники в проектирова­
нии — деструктивной проверкой. П редлагаемый план подвергается влия­
нию условий, предназначение которы х — направить и вывести его за преде­
лы жизнеспособности. Т акая контролируемая деструкция мож ет сама про­
ясн ять, где на нее следует полагаться, и почему она срабатывает, когда сра­
батывает. П римененная к поведенческому феномену, эта философия содей­
ствовала бы исследовательским попы ткам описать условия, при которых
она наблю дается, и психологические процессы, которые нужно вы зы вать
или контролировать, чтобы ее устранить. Там, где феномен — это преду­
беж дения в суж дениях, деструктивная проверка принимает форму попы­
ток освобождения от предубеждения. Д еструктивная проверка показы ва­
ет, где планирование терпит неудачу; когда терпит неудачу предубеждение,
результатом этого становится улучш енное суждение.
И сследование эвристики и предубеждений может само рассматриваться
к ак применение деструктивной проверки к более ранним гипотезам о том,
что люди являю тся компетентными интуитивны ми статистикам и. Случай­
ное наблюдение наводит н а мы сль, что суж дения людей обычно “достаточ­
но хорош и”, чтобы люди в течение своей ж изни не попадали в слиш ком боль­
ш ие неприятности. Ранние исследования (P eterson & Beach, 1967) поддер­
ж иваю т это убеждение, показы вая, что при первом приближ ении людей
можно описывать к ак достоверных наблюдателей и нормативных оценива­
ю щ их. Последующие исследования, представленные в этом разделе, прове­

*Выражаю свою благодарность Ruth Beyth-Marom, Don MacGregor и Paul Slovic за их полез­
ные комментарии к ранним проектам этой статьи. Эта работа была поддержана Службой
морских исследований согласно контракту № 000 14-80-С-0150 с Perceptronics, Inc.
Освобождение от предубеждения 483
ряли точность этого приближ ения, рассматривая пределы очевидного успе­
ха людей. Сможет ли лучш ее суждение сделать их богаче или здоровее?
Можно ли отнести их успех на счет их снисходительного окруж ения, кото­
рое не предполагает особенно осведомленного поведения? Трагические ошиб­
ки обеспечивают важную способность проникновения в природу и качество
процесса принятия реш ений у людей; к счастью, они довольно редки, так
что у нас слиш ком м аленькая база данных, чтобы определить факторы , ко­
торые могут сбивать людей с пути. Исследование суждений использовало
деструктивно-проверяющую стратегию для генерирования подверженных
предубеждению суждений в ситуациях охарактеризованных с умеренной
точностью. Теоретик надеется, что появится модель ошибок и успехов, ко­
торая послуж ит для нескольких возможных объяснений. Таким образом,
исследование предубеждений проясняет источники и пределы очевидной
мудрости, точно так ж е, к ак исследование освобождения от предубеждений
проясняет источники и пределы очевидной глупости. Оба являю тся суще­
ственными для изучения суждений.
Хотя некоторые исследования суждений являю тся, прежде всего, демон­
страцией того, что определенное предубеждение может появиться в некото­
рых, возможно, выдуманных, условиях, многие другие исследования пред­
принимали попытки подтасовки данных против наблюдения предубеждений.
Некоторые из этих исследований являю тся освобождающими от предубеж­
дений, и они проводятся в надежде, что процедуры, доказавш ие свою эффек­
тивность в лабораторных условиях, такж е будут способствовать улучшению
результатов и в естественных условиях. Другие имеют более теоретическую
цель прояснить контекст, вызывающ ий субоптимальные суждения. Сущ­
ность этого раздела состоит в обзоре исследований, которые можно истолко­
вать, как попытки уменьшить два обычных предубеждения — предубежде­
ние ретроспективного взгляда и -гоезмерную уверенность. Он рассматривает
неудачи, равно как и успех, в убеждении, что (а) неудача помогает прояснить
опасность проблемы и необходимость корректирую щ их или защ итных мер,
и (б) общая модель исследований является ключом к открытию психологи­
ческих измерений, важных при характеристике жизненных ситуаций и пред­
видении степени их подверженности предубеждению.
Мы стремились к полноте обзора, придерж иваясь следующих трех отбо­
рочных критериев:
1. Рассматриваю тся только исследования, опубликованные в ис­
точниках с подобными обзорами. Таким образом, ответственность
за контроль качества экстернализирована.
2. Исклю чаются эпизодические свидетельства (с некоторыми ис­
клю чениями). Х отя такие отчеты являю тся главным источником
информации о некоторых видах попыток освобождения от преду­
беждений (например, использование экспертов), они подвержены
интерпретационному и отборочному предубеждениям, которые тре-
484 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
буют особого вним ания вне сферы этого излож ения (см. Главу 23).
3. П редполагается некоторое эмпирическое основание. И склю чаю тся
предполож ения, которые еще необходимо проверить, и теоретические до­
воды (например, об экологической валидности экспериментов), которые
невозможно проверить.
Перед обзором будет предложено основание для попыток освобождения
от предубеждений, характеризую щ ее возможные подходы и предположе­
н и я, леж ащ ие в их основе. Такое основание может обнаружить повторяю­
щ иеся модели, будучи примененным к разнообразным предубеждениям в
суж дениях.

М етоды о св о б о ж д ен и я от п ред у б еж д ен и й
Когда сущ ествует проблема, вполне естественно искать виновного. Проце­
дуры освобождения от предубеждения наиболее ясно могут быть категори­
зированы согласно подразумеваемому безусловному утверждению о винов­
ности . Наиболее важное различие состоит в том, лож ится ли ответственность
за предубеждение на человека, принимающ его реш ение, на задачу или на
определенное несоответствие между ними. Представляю т ли предубежде­
н и я артеф акты некомпетентного экспериментирования и сомнительной
интерпретации, четкие случаи ошибочных суждений или неудачный резуль­
тат деятельности экспертов, имею щ их, но неправильно применяю щ их ког­
нитивны е умения? К ак подытожено в табл. 1 и описано ниж е, каж дая из
этих категорий мож ет подразделяться дальш е согласно тому, что можно
назвать глубиной проблемы. Н асколько фундаментальна сложность? Необ­
ходимы ли технические или структурные изменения? Стратегии для разра­
ботки техник освобождения от предубеждений различны для различны х
причинны х категорий.

Таблица 1. Методы освобождения от предубеждений согласно основным


предположениям

Предполож ение Стратегии


Задачи с искаж ениями
Задачи с ложными Поднять ставки
условиями Прояснить инструкции (стимулы)
Препятствовать ошибочному пониманию
Использовать лучшие способы ответов
Задавать меньше вопросов
Освобождение от предубеждения 485
Продолжение табл.1

Неправильно понятые Демонстрировать альтернативную цель


задачи Демонстрировать семантическое несогласие
Демонстрировать невозможность задачи
Демонстрировать обозреваемое различие
Ошибающиеся эксперт ы
Способные к Предупредить о проблеме
совершенствованию Описать проблему
Обеспечить личную обратную связь
Экстенсивно тренировать
Не поддающиеся Заменить их
коррекции Внести поправку в их ответы
Планировать на основе ошибок
Н есоответствие между
оценивающ ими и задачей
Реструктурирование Сделать знания точными
Искать противоречивую информацию
Разложить проблему на составные части
Рассмотреть альтернативные ситуации
Предложить альтернативные формулировки
Обучение Полагаться на надежных экспертов
Обучать с детства

Задачи с искаж ениями


Задачи с ложными условиями. У экспериментаторов есть стандартные воп­
росы, которые они ставят перед своей работой и работой других. Исследова­
ния публикую тся только в том случае, если они внушают уверенность (в
обозревателей или редакторов), что более очевидные артефакты исклю че­
ны. Однако поскольку невозможно контролировать все и удовлетворить всех
в начальном исследовании или серии исследований, попытку дискредити­
ровать эффект, прежде всего, начинаю т с идентификации предполагаемых
методологических артефактов. Среди требований, которые могут возник­
нуть, такие: (а) испытуемые равнодуш ны к задаче, — следовательно, необ­
ходимо поднять ставки, ведущие к лучш ему выполнению; (б) задача приве­
ла испытуемых в замеш ательство, — следовательно, необходимо использо­
вать более подробные инструкции и знакомые стимулы; (в) испытуемые не
верили утверж дениям экспериментатора о природе задачи или приняли
другую структуру результатов вы полнения, отличную от заданной, — сле­
довательно, необходимо заверить их в том, что их наилучш ая догадкао пра­
вильном ответе — это все, что интересует, и что им следует отвечать так, к ак
они считаю т наиболее подходящ им; (г) испытуемые были не в состоянии
вы разить то, что они знают, — следовательно, необходимо использовать бо­
лее знакомые и гибкие способы ответов; (д) испытуемым задали слиш ком
486 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
много вопросов и предлож или стереотипные образцы ответа, чтобы помочь
им справится с задачей, — следовательно, необходимо задавать меньш е воп­
росов (или тогда определить свой исследовательский интерес к ак стереотип­
ные ответы).
Преодоление таких проблем — это часть хорошей научной чистоты. Од­
н ако, теоретическое содерж ание таких попы ток обычно незначительно.
П оскольку его целью является лучш ее экспериментальное окружение, ис­
следование артефактов мож ет быть даже не информативным с точки зре­
н ия мира контекстов, к которым можно благополучно обобщить наблюдав­
ш иеся результаты . “Успешные” исследования артефактов обеспечивают,
главны м образом, негативной информацией, заставляю щ ей сомневаться, в
“справедливы х” ли условиях результат был достигнут. “Справедлива” ли
ж и знь в том ж е смысле, когда она ставит вопросы, — это уж е отдельный
вопрос.

Неправильно понятые задачи. И сследования артефактов подразумева­


ют небрежность эксперимента. Подлинному исследователю следовало бы
больш е знать и быть более старательным. Подобные утверж дения являю т­
ся менее уместными в отношении второго вида недостатков задач: несосто­
ятельность исследователя понять феноменологию респондента или его кон­
цептуальны й мир. К ритики, равно как и сторонники подхода эвристики
предубеждений, использовали переформулировку задачи для того, чтобы
прояснить, что испытуемые действительно делали. Среди способов, кото­
ры е могут быть предприняты , чтобы показать мудрость явно подверженно­
го предубеждению поведения, такие: (а) демонстрация некоторой альтер­
нативной цели, достигнутой принесением в ж ертву оптимальности в рас­
сматриваемой задаче (например, знакомиться со свойствами системы, де­
л ая диагностические ош ибки); (б) демонстрация того, что респондент раз­
деляет определение клю чевых терминов, отличное от поддерживаемого или
предложенного экспериментатором; (в) демонстрация того, что задача не
мож ет быть выполнена до тех пор, пока респонденты не сделают некоторые
дополнительны е предполож ения, которы е долж ны случайно совпасть с
предполож ениями экспериментатора; (г) демонстрация того, что испы туе­
мые делают обоснованное различие, к которому экспериментатор был не­
чувствителен.
Чтобы внести свой вклад, такие переформулировки должны вклю чать
эмпирическую демонстрацию, а не просто утверж дения о том, “что могли
бы думать испытуемые”. В худшем случае, такие утверж дения могут иметь
вы раж енную особенность и вы зывать фальсификацию ; в самом деле, про­
тиворечивые версии могут быть использованы для объяснения различны х
предубеждений. В лучш ем случае, они могут образовать сильные теорети­
ческие утверж дения о когнитивны х репрезентациях (Fischhoff, в печати).
Освобождение от предубеждение 487

Ошибки экспертов
Способные к совершенствованию. Если проблема бы ла хорошо проработа­
на, а предубеждение осталось, некоторую ответственность должен принять
на себя респондент. Чтобы ликвидировать неж елательное поведение, необ­
ходимо использовать эскалационны й план с ш агами, отражаю щ ими уве­
личиваю щ ийся пессимизм в отношении легкости соверш енствования вы ­
полнения задачи человеком: (а) предупреждение о возможности возникно­
вения предубеждения без определения его природы (эта стратегия отлича­
ется от поощ рения людей работать более усердно, подразумевая, что потен­
циальная ош ибка является систематической, и респондентам нуж на инст­
рукция, а не просто благоприятный случай); (б) описание направления (а,
возможно, и степени) предубеждения, которое типично наблюдается; (в)
обеспечение определенной порции обратной связи, персонифицирующей то,
что подразумевается в предупреждении; (г) предложение обширной програм­
мы тренировки с обратной связью , тренерства и всего, что необходимо для
когнитивного мастерства респондента в задаче.
Такие ш аги обвиняют оценивающего, а не задачу, предполагая, что ре­
ш ения не возникнут самопроизвольно или только лиш ь при тщ ательном
перефразировании вопросов. Несмотря на огромный практический вклад,
тренировка мож ет ограничить теоретическое влияние. П опытка найти спо­
соб, который работает, может привести к созданию целого набора манев­
ров, чьи элементы эффективности плохо определены. Тогда, может, будут
нужны более систематические эксперименты, чтобы идентифицировать эти
элементы. Конечная цель — это понимание того, чем отличается искусст­
венный опыт, полученный в тренировочных программах, от естественного
опыта, предлагаемого жизнью . Почему одна техника по ликвидации пре­
дупреждения работает, тогда к ак другая нет?

Не поддающиеся коррекции эксперты. В некоторых случаях тренер мо­


ж ет реш ить, что успех невозможен или достижим только при участии про­
цедур, заставляю щ их испытуемого отвечать оптимально. “У спех", который
достигнут при существенной подсказке правильного ответа или создании
неуклончивы х характеристик запроса, лиш ен как теоретического, так и
практического интереса. Не является новостью, что люди слуш ают то, что
им говорят; но если им нужно каж ды й раз говорить, как следует отвечать,
то кому они нужны?
В таких ситуациях существует три опции: (а) замена людьми, умеющи­
ми отвечать лучш е; (б) внесение поправок в ошибочные суж дения, предпо­
лагая, что количество и направление ошибок предсказуемы; (в) пнизнание
неточности в суж дениях людей при планировании действий на их основе.
П ринимающ ий реш ение или аналитик, махнувш ий рукой на лючей в лю­
бом из этих способов, все ещ е может внести вклад в наш е понимание сужде­
ний оценкой размера, степени преобладания и упругости таких неисчезаю­
488 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
щ их предубеждений. Однако так к ак улучш енное суждение не является
целью этих корректирую щ их действий, здесь они будут рассматриваться
поверхностно.

Н есоот вет ст вие между экспертом и задачей


Реструктурирование. Возможно, сам ая милосердная и психологическая
точка зрения состоит в том, чтобы не указы вать пальцем и не обвинять ни
эксперта, ни задачу. Вместо этого, предположим, что вопрос поставлен при­
емлемо, и что у эксперта есть все требуемые умения, но каким-то образом
эти умения не использую тся. В духе инженерной психологии этот подход
доказы вает, что надлеж ащ ей единицей наблюдения является система че­
ловек-задача. Успех состоит в том, чтобы сделать их к ак можно более со­
вместимыми. Подобно тому, к ак механически не поврежденному самолету
необходима хорош ая конструкция приборов, чтобы быть управляемы м,
правильная (то есть, не вводящ ая в заблуждение) задача может только тог­
да поддаваться обработке, если она будет реструктурирована в форму, по­
зволяющ ую респондентам использовать те когнитивны е умения, которые у
них есть, с наибольш им преимуществом.
Х отя такое когнитивное проектирование является специфичным для за­
дачи, имеется ряд повторяю щ ихся стратегий: (а) принуж дать респонден­
тов вы раж ать то, что они знаю т, ясно, а не позволять остаться этому “в голо­
ве”; (б) поощ рять респондентов к поиску противоречивых свидетельств, а
не собирать детали, подтверждающие предпочитаемый ответ; (в) предлагать
способы разлож ения непреодолимой проблемы на более поддающиеся об­
работке и знакомы е компоненты; (г) подталкивать респондентов к рассмот­
рению набора возможных ситуаций, с которыми они, возможно, сталкива­
лись, чтобы лучш е понять данную специфическую проблему; и (д) предла­
гать альтернативны е формулировки представленной проблемы (то есть, ис­
пользовать различны е термины, конкретизировать, предлагать аналогии).

Обучение. Вариант подхода “система человек-задача” состоит в утверж ­


дении, что люди могут реш ить эту задачу, но не эти люди. Здесь должны
использоваться альтернативы: (а) эксперты , которые, наряду с их основа­
тельными знаниям и, приобрели некоторые особые способности по обработ­
ке информации в условиях неопределенности; или (б) новый вид людей, обу­
чаю щ ийся с раннего возраста думать вероятностно. В определенном смыс­
ле этот взгляд говорит о том, что, хотя люди, в принципе, не являю тся неис­
правимы ми, большинство окруж аю щ их все ж е таковы. Обучение отлича­
ется от тренировки (предыдущ ая категория) своим фокусом на развитии
общ их способностей, а не специфических умений.
Освобождение от предубеждения 489
Р е тр о с п ек ти в н о е п р ед у б еж д ен и е: П р и м ер п о п ы тк и о сво б о ж д ен и я
Критическим аспектом любой работы является научение на основе опыта.
Узнав однажды, чем что-то оборачивается, мы стараемся понять, почему
это произош ло, и оценить, насколько хорошо мы или другие были к этому
готовы. Х отя думают, что подобные знания о результатах дарят мудрость
ретроспективного взгляда наш им суж дениям, их преимущ ества могут быть
преувеличены. О глядываясь в прош лое, люди последовательно преувели­
чиваю т то, что мож ет предвидеть предусмотрительность. Они не только на­
мерены рассматривать то, что случилось, как неизбежное, но такж е и рас­
сматривать это к ак казавш ееся “относительно неизбежным” перед тем, к ак
случиться. Люди уверены, что другим следует быть способными предвидеть
события намного лучш е, чем это было на самом деле. Они даж е свои пред­
сказания запоминаю т неправильно, с тем, чтобы преувеличить в ретроспек­
тивном взгляде то, что они знали из предвидения (F ischhoff, 1975). Х отя
лестно верить, что мы все время будем знать все, что только можем знать,
огляды ваясь в прош лое, это убеждение едва ли сможет позволить нам спра­
ведливую оценку степени, в которой неожиданности и неудачи являю тся
неизбежными. Несправедливо и саморазруш аю щ е критиковать принима­
ющих реш ения людей, которые заблуждаю тся в ошибочных системах, не
признавая этой ошибочности и не делая чего-либо для улучш ения системы.
П оощ ряя нас в преувеличении наш их знаний, это предубеждение может
сделать нас чересчур уверенными в своей предсказательной способности.
Восприятие прошлого без неожиданностей может предвещ ать полное нео­
жиданностей будущее.
Исследование этого предубеждения включило исследования большинства
возможных стратегий, вклю ченных в предыдущ ий раздел. Некоторые из
этих техник успешно уменьш или предубеждение прошлого опыта; но ни
одна не ликвидировала его. Они описаны ниж е и подытожены в табл. 2.

Задачи с искаж ениями


Задачи с ложными условиями. В первоначальной экспериментальной демон­
страции предубеждения ретроспективного взгляда (Fischhoff, 1975) испы ­
туемые читали параграфы с описаниями исторического события и оценива­
ли вероятность того, что они смогли бы определить для каждого действую­
щего лица возможные последствия, не будучи осведомленными о том, что
произош ло. Независимо от того, был ли сообщенный результат правдивым
или лож ны м (то есть, случилось ли это в действительности), испытуемые
были уверены, что они определили бы этому более высокую степень вероят­
ности, чем было сделано испытуемыми, неосведомленными о результатах.
Это исследование находится в списке попыток освобождения от предубеж­
дения. Сосредоточиваясь на нескольких эпизодах, оно отвечает методоло­
гической критике “слиш ком большого количества вопросов”, которая мо­
490 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
ж ет быть противопоставлена последующим исследованиям. Другие иссле­
дования с малым количеством вопросов, которые не ликвидировали преду­
беждение ретроспективного взгляда, проводили Slovic и Fischhoff (1997);
испытуемые анализировали вероятность возможных результатов в несколь­
ки х научны х экспериментах; M itchell и Kalb (в печати), медсестры оцени­
вали инциденты , взяты е из практики работы больниц; Pennington, R u tter,
M cKenna и Мог ley (1980), ж енщ ины оценивали для себя возможность полу­
чить полож ительны е результаты по тесту беременности (хотя н и зкая мощ ­
ность этого исследования делает его вывод предварительным).
Среди других попыток демонстрации артефактного источника предубеж­
дения ретроспективного взгляда, которые предпринимались, но потерпели
неудачу, следующие. Замещение ш калированных суждений о “неожиданно­
сти” оценкой вероятности (Slovic & Fischhoff, 1977). Использование более
однородных вопросов, позволяющих полнее привлекать знания одной фор­
мы, а не использование вопросов общего знания, разбросанных по различ­
ным областям, ни в одной из которых нельзя было бы глубоко поразмыслить
(F ischhoff & B eyth, 1975). Уговаривание испытуемых работать усерднее
(F ischhoff, 1977b). П опы тки рассеять сомнения о природе эксперимента
(G. W ood, 1978). Использование современных событий, которые эксперты рас­
смотрели с точки зрения предвидения, прежде чем осуществить оценивание
с точки зрения ретроспективного взгляда (Fischhoff & B eyth, 1975).

Неправильно понятые задачи. Возможно единственная привлекательность


предубеж дения ретроспективного взгляда в том, что он может быть доста­
точно льстивы м, чтобы представить человека к ак все время знавш его, что
долж но было произойти. За такую незаслуженную лесть человек платит
только в том случае, если (а) его предусмотрительность приводит к действи­
ям , каж ущ им ся глупы ми с точки зрения ретроспективного взгляда. Или
если (б) систематическое преувеличение того, что он знал, приводит к чрез­
мерной уверенности в том, что он знает сейчас, возможно, становясь причи­
ной непостоянных действий или неудачи в поиске необходимой информа­
ции. Так к ак эти длительны е последствия не являю тся в значительной сте­
пени релевантны ми в типичном эксперименте, возможно беспокойство об
испы туемы х, подвергнутых искуш ению нарисовать себя в более выгодном
свете. Х отя многие эксперименты являлись, скорее, проверкой способнос­
ти испы туемы х реконструировать предусматривающее состояние знания,
чем проверкой, насколько экстенсивным было это знание, искуш ение пре­
увеличивать все ж е могло остаться. Если это так, они отразят противоречие
меж ду интерпретацией задачи испытуемым и экспериментатором. Одна из
м анипуляций д ля ликвидации такой возможности требует, чтобы испыту­
емые сначала ответили на вопросы, а затем запомнили свои ответы, с тем,
чтобы под вопросом бы ла острота их пам яти (Fischhoff, 1977b; Fischhoff &
B eyth, 1975; P ennington и др., 1980; G. W ood, 1978). Вторая манипуляция
требует, чтобы испытуемые с ретроспективным взглядом оценили ответы,
Освобождение от предубеждения 491
данные другими испытуемыми с точки зрения предусмотрительности, пред­
полагая, что у них не будет основания преувеличивать то, что знали другие
(Fischhoff, 1975; G.W ood, 1978). Ни одна из манипуляций не оказалась ус­
пеш ной. Испытуемые помнили себя к ак более знаю щ их, чем это было на
самом деле. Они были немилосердными, в смысле преувеличения, делая
ошибочные догадки о том, что другие знали (или должны были знать) с точ­
ки зрения предусмотрительности.

Ошибки экспертов
У читься избегать предубеж дений, возникаю щ их оттого, что являеш ься
пленником собственной современной перспективы , — вот что составляет
фокус тренировки историков (см .гл.23). Однако не проводилось никаких
эмпирических исследований успешности таких попыток. А кцент, который
историки делают на первичны х источниках с их отчетами восприятия про­
ш лого, может отраж ать ощ ущ ение, что человеческое сознание достаточно
неисправимо, чтобы изучать дисциплину такого рода по документам. Одно
из исследований по экспериментальной тренировке, хотя и использует зна­
чительно менее строгую процедуру, не дает никаких оснований для опти­
мизма. Fischhoff (1977b) ясно описы вал это предубеждение испытуемым и
просил их избегать его в своих суж дениях — напрасно.

Несоот вет ст вие между эксперт ами и задачами


Реструктурирование. Бы ли приняты три стратегии для реструктурирова­
ния задач ретроспективного взгляда так, чтобы сделать их более совмести­
мыми с когнитивными умениями и предрасположениями, которые привнес­
ли в них эксперты . Одна из таких стратегий отделяет испытуемых во време­
ни от сообщения о событии в надежде уменьш ить его тенденцию доминиро­
вать над их полем перцепции (F ischhoff & B eyth, 1975; G. W ood, 1978); эта
стратегия бы ла неэффективной. Согласно второй стратегии, эксперты оце­
нивали вероятность повторения сообщаемого события, а не вероятность того,
что оно случится, в надежде, что неопределенность будет в большей степени
присутствовать в перспективе ож идания (M itchell & K alb, в прессе; Slovic &
Fischhoff, 1977); она такж е потерпела неудачу. П оследняя стратегия требу­
ет, чтобы испытуемые указали, к ак они могли бы объяснить наличие исхо­
да, которого в действительности не было (Slovic & Fischhoff, 1977). Вовле­
чение такого негативного свидетельства ощутимо сниж ает неизбежность
сообщаемого события, в отношении которого выносится суждение. Такое
противоречивое свидетельство было явно в наличии в пам яти или вообра­
ж ении испытуемых, но недоступно без структурирования проблемы.

Обучение. Существуют некоторые экспериментальные свидетельства о том,


что ретроспективное предубеждение уменьш ается при интенсивном вовле­
492 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
чении в проблему профессионального обучения. D etm er и Fryback (1978)
обнаруж или ретроспективное предубеждение в суж дениях хирургов (как
университетских преподавателей, так и практикую щ их), оцениваю щ их
эпизод, вклю чаю щ ий возможный разры в брюшной аорты при аневризме.
A rkes, W ortm arm , Saville и H arkness (1981) продемонстрировали предубеж­
дение у врачей, рассматривавш их клиническое описание бармена с острой
болью в колене. M itchell и Kalb (в печати) обнаружили предубеждение в
оценке медсестер о результатах действий подчиненных. Если людей выно­
сящ их суж дения о событиях в собственной ж изни, рассматривать к ак н а­
стоящ их экспертов, тогда исследование Pennington и др. (1980) суждений
ж енщ ин о результатах их собственного теста беременности може^ рассмат­
риваться к ак ещ е один пример предубеждений у экспертов. Д аж е в еще бо­
лее ограниченном смысле экспертизы , G. W ood (1978) обнаружил, что в за­
даче с вопросами общего знания наиболее знаю щ ие испытуемые были не
менее склонны к предубеждению, чем менее знаю щ ие. Краткое свидетель­
ство того, к ак эксперты стали ж ертвой этого предубеждения, кратко изло­
ж ено в Главе 23 (этого издания). Оно вклю чает к ак наблюдение причин, так
и исчерпывающ ие исследования, такие как исследование W ohlstetter (1962),
которы й охарактеризовал попы тки вы соко мотивированны х экспертов,
входивш их в состав комитета по расследованию событий в Перл-Харбор,
к ак 39 томов ретроспективных предубеждений.

Резюме
Будучи хотя и одной из наименее изучавш ихся проблем, предубеждение рет­
роспективного опыта побудило проведение достаточного количества исследо­
ваний, чтобы сделать возможными некоторые общие экспериментальные ут­
верждения: оно достаточно устойчивое и широко распространенное. Чтобы его
уменьшить, необходимо некоторое понимание когнитивных процессов у лю­
дей и гипотезы о них. Одна из таких гипотез состоит в том, что образ действия,
который обычно предпринимают люди в подходе к ретроспективным задачам,
не использует их знания и умения делать выводы с наибольшим преимуще­
ством. Создание противоположных свидетельств со всей очевидностью частич­
но справляется с этой проблемой и помогает людям лучше использовать свое
мышление (Slovic & Fischhoff, 1977).
Однако, перед тем как подтвердить это заключение, необходимо обратиться
к целому ряду эмпирических вопросов: (а) какие дополнительные ш аги необ­
ходимо сделать, чтобы ликвидировать это предубеждение, а не только умень­
ш ить?; (б) будет ли работать эта процедура в менее ясно структурированных
задачах?; (в) будет ли достаточной практика процедуры в некоторых стандарт­
ных задачах, чтобы изменить поведение в других задачах, где нет специфичес­
ких инструкций? Процедура освобождения от предубеждения будет даже бо­
лее проблемной, чем это есть, если она повысит веру людей в свои способности
выносить суждения больше, чем улучш ит сами эти способности.
Освобождение от предубеждения 493
Ч р езм ер н ая уверен н ость: П оп ы тки освобож д ен и я от п редубеж ден и я
“П ринятие решений в ситуациях неопределенности” подразумевает непол­
ное знание. К ак результат этого, одним из основных компонентов принятия
таких реш ений является оценка качества любого знания, имеющегося в
наличии. Х отя статистические методы могут руководить этой оценкой, по
той или иной причине необходимо суждение, чтобы оценить уверенность,
которую можно вселить в чью-либо лучшую догадку о положении вещей.
Так к ак неправильная оценка уверенности может привести к плохим реш е­
ниям, вы зы вая либо чрезмерную, либо недостаточную осторожность, то и в
дальнейш ем фокус исследования суждений состоит в идентификации ф ак­
торов, влияю щ их на уверенность неподходящ им образом. Получение зна­
ний по результатам — это один из таких факторов, поскольку он ведет к
тому, что люди преувеличиваю т полноту своих собственных знаний. Хотя
подозревают, что знания по результатам делают людей чрезмерно уверен­
ными в своих знаниях, все ж е понятно, что люди подвержены некоторому
роду эндемической недостаточной уверенности, полезным противовесом
которой является ретроспективное предубеждение. Прояснение этой воз­
можности требует исследовательской оценки абсолютной валидности суж ­
дений об уверенности.
Так к ак трудно оценить абсолютную валидность любого единичного суж ­
дения об уверенности, большинство исследований в этой области рассмат­
ривали качество, или калибровку, набора суж дений, каж дое из которых
представляло собою субъективную вероятность, что утверж дение ф акта
является правильны м (Глава 22, этого издания). Д ля отлично калиброван­
ного индивида оценки, скаж ем 0,70, ассоциируются с правильны ми утвер­
ж дениями в течение 70% времени.
Ч резм ерная уверенность — гораздо более распространенное событие.
Типичное исследование может показы вать вероятность 0.75, чтобы ассоции­
роваться только с 60% “попаданием”, и выражения определенности (р = 1,00),
правильны только в течение 80% времени. Когда люди оценивают, как много
они знаю т о значениях количеств, вы раж енны х численно (например, “Я
уверен на 0,98, что количество зарегистрированных избирателей-республи-
канцев в округе Лейн где-то между 12.000 и 30.000”), не будет необычным
обнаружить правдивые ответы, выпадаю щ ие из их 98-процентного интер­
вала уверенности от 20% до 40% времени. Такие результаты беспокоят как
тех, кто должен полагаться на оценки уверенности, так и тех, кто обвинен
(прямо или косвенно) в преувеличении того, к ак много они знают. Полно­
масштабное исследование, которое проводилось с целью опровергнуть, дис­
кредитировать, поддержать или ограничить наличие чрезмерной уверенно­
сти, охарактеризовано ниж е в перспективе попыток освобождения от пре­
дубеждения. Значительную помощь в этом повторном анализе существую­
щ их исследований оказало наличие нескольких исчерпываю щ их обзоров
литературы, хотя и осуществленных для несколько других целей. Они вклю ­
494 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
чаю т H enrion (1980), H ogart(1975), L ichtenstein, Fischhoff и P hillips (Глава
22), и W allsten и Budescu (1980). Этот повторный анализ был усложнен тем,
что многие из цитируемы х исследований проводились такж е и для некото­
ры х других целей. И к ак результат этого, они не всегда точно подходили
под одну категорию освобождения от предубеждения. Это незначительное
несоответствие мож ет наклады вать ограничения на настоящ ую категори­
альную схему (делая различия неясными) или н а исследования (смеш ивая
м анипуляции по освобождению от предубеждения).

Задачи с искаж ениями


Задачи с ложными условиями. П рикладная причастность чрезмерной уве­
ренности породила огромное количество технических попыток ее искоре­
нения, почти все из которы х оказались неуспеш ными. Многие из них вклю ­
чали м анипуляции с моделями ответов, такие к ак сравнение вероятности и
оценку уверенности (Ludke, S tauss & G ustafson, 1977), или изменение ин­
тервалов уверенности, оцененных в процессе формирования распределения
субъективной вероятности (Selvidge, 1980). Избавленные от необходимос­
ти производить и оправдывать свои м анипуляции н а основе некоторы х су­
щ ествую щ их теорий, экспериментаторы, использующ ие подобные “проек­
тирую щ ие” подходы, часто обнаруживаю т огромную изобретательность в
процедурах, которые они готовы испробовать. Однако, отсутствие теории,
кроме того, затрудняет понимание того, к ак интерпретировать или обобщать
их успехи и неудачи. Например, Seaver, von W in terfeld t и Edw ards (1978)
обнаруж или, что чрезмерная уверенность бы ла меньш е, когда интервалы
уверенности были получены методом “фиксированных значений”, при ко­
торы х экспериментатор отбирал значения, а испытуемые оценивали их ве­
роятность, чем методом “фиксированной вероятности”, при котором экспе­
риментатор обеспечивает вероятность, а респондент дает ассоциированное
значение. Этот успех мож ет отраж ать некоторого рода большую совмести­
мость меж ду методом “фиксированных значений” и психологическими про­
цессами респондента, или он мож ет отраж ать информацию о действитель­
ном значении, вы раж енную выбором экспериментатора ф иксированных
зн ач ен и й . П одобны й р езу л ьтат, полученны й Т верским и К анем аном
(T versky K ahnem ann, 1974, 1), основывается на гипотетически принятой
эвристике “заякорить-и-отрегулировать”, хотя и здесь могут быть испы ту­
емы е, проинформированные о фиксированных значениях.
Кроме довольно интенсивного поиска правильного способа ответов для
извлечения уверенности, такж е были предприняты попы тки ликвидации
других угроз справедливости задач, которые перечислены в верхнем разде­
ле Таблицы 1. Н апример, огромное число ответов, взяты х во многих иссле­
дованиях калибровки с тем, чтобы получить статистически надеж ны е ин ­
дивидуальны е результаты , может быть предметом интереса, наблюдалась
ли чрезм ерная уверенность в исследованиях с 10 или даж е 1 вопросом к ис­
Освобождение от предубеждения 495
пытуемому (например, Hynes & Vam narcke 1976; L ichtenstein и Fischhoff,
1977). Краткость инструкций, использованных в некоторых исследовани­
ях, может вы зы вать беспокойство, не были ли получены подобные резуль­
таты с инструкциями, которые настолько пространны и подробны, насколь­
ко могут вынести испытуемые (например, Глава 21; L ichtenstein и Fischhoff,
1980b). Исчерпывающий характер, даже педантичность таких инструкций,
может так ж е рассматриваться, как противоядие к любым попыткам испы­
туемых ошибочно понять исследователя. Что касается ясности использо­
ванных стимулов, не было замечено никаких изменений в чрезмерной уве­
ренности при замене различны х наборов вопросов общего знания на наборы
однородных вопросов (например, Fischhoff & L ichtenstein, 1980; Oskamp,
1962) или наборы невербальны х “перцептивны х” стимулов (например,
Daws, 1980; L ichtenstein & Fischhoff, 1980b).
Было бы самоуспокоенностью верить, что чрезмерная уверенность исче­
зает, когда поднимаю тся ставки, и судьи действуют “реально” (то есть, не
просто для эксперимента). К сожалению , исследовательские стратегии, ко­
торые могут быть использованы для изучения этой гипотезы , склонны на­
толкнуться на трудности интерпретации. Одним из очевидных подходов
является мониторинг вы раж ения уверенности экспертами, выполняю щ и­
ми свои обычные задачи. Он фрустрируется возможностью того, что вы ра­
жения экспертов оцениваю тся на основе критерия, который противоречит
калиброванию, то есть, может иметь место поощрение за намеренно прояв­
ляемую чрезмерную уверенность или за чрезмерную осторожность. Н апри­
мер, к о гд а в р ач и п ереоц ен и ваю т вер о ятн о сть б ол езн и (н ап р и м ер ,
C hristensen-Szalanski & B ushyhead, 1981; L u sted , 1977), это мож ет быть из-
за того, что они не имеют представления, насколько хорошо они осведомле­
ны, или из-за беспокойства о плохом лечении, алчности к финансовому воз­
награждению, которое могут принести дополнительные тесты, или других
интересов, не соответствующих настоящ им целям. И з-за этих сложностей
исследования с участием экспертов перечислены в конце посвящ енного им
раздела в Таблице 2, в отличие от попыток поднять ставки.
Вторая стратегия поднятия ставок состоит в присоединении оценивания
уверенности к внутренне важным задачам, для которых это оценивание не
имеет никакой действенной причастности. Так, Sieber (1974) сделал это,
попросив студентов отметить свою уверенность в своих собственных отве­
тах при тестировании. Результатом была (не имеющ ая подобных) чрезмер­
ная уверенность, возможно, из-за того, что градуировка была невосприим­
чива к вовлеченным ставкам, а возможно, из-за того, что этот метод был
неэффективен в их поднятии. Теоретически соверш енная стратегия мани­
пулирования ставками — это поощрение испытуемых надлеж ащ ими пра­
вилами накопления баллов, которые наказы ваю т неискренние вы раж ения
неопределенности. Такие правила, однако, довольно асимметричны, в том
смысле, что они наказы ваю т чрезмерную уверенность намного сильнее, чем
недостаточную уверенность. Результатом этого является то, что испытуе­
496 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
мые, которые понимают суть этих правил, но не интересуются их деталя­
м и, могут интерпретировать правила накопления баллов как общую инст­
рукцию никогда не вы раж ать большой уверенности. В таком случае, люди
могут просто механически уменьш ать свою уверенность, не улучш ив пони­
м ания. Возможно, самым лучш им из всех способов заставить испытуемого
работать старательно является применение стандартных техник экспери­
ментаторов для усиления внутренней мотивации задачи и вовлеченности в
нее испытуемого.

Таблица 2. Опыт по освобождению от предубеждения

Исследования, Исследования,
Стратегии рассматриваю­ рассматри­
щие ретроспек­ вающие
тивное пре­ чрезмерную
дубеждение уверенность
Задачи с искажениями
Задачи с ложными условиями
Поднять ставки 4 1,30
Прояснить инструкции (стимулы) 6 3,10,13,14,21
Препятствовать ошибочному пониманию 11 13,21
13,14,20,22,23,
Использовать лучшие способы ответов 9 32,34,357,36,40
Задавать меньше вопросов 3,7,8,9 16
Неправильно понятые задачи
Демонстрировать альтернативную цель 3,4,6,8,9 14
Демонстрировать семантическое
несогласие 3,14,19,30
Демонстрировать невозможность задачи — 13
Демонстрировать обозреваемое различие 15
Ошибки экспертов
Способные к совершенствованию
Предупредить о проблеме — 13
Описать проблему 4 3
Обеспечить личную обратную связь — 21
1,2,4,17,21,26,
Экстенсивно тренировать 5? 27,31,34
Не поддающиеся коррекции
Заменить их _
Внести коррекцию в их ответы — 2,5,24
Осуществлять проект на основе ошибок — —
Освобождение от предубеждения 497
Продолжение табл. 2.

Несоответствие между экспертами и


задачей
Реструктурирование
Сделать знания точными _ 18
Искать противоречивую информацию 9 18
Разложить проблему на составные части 6,11 —
Рассмотреть альтернативные ситуации — —
Предложить альтернативные
формулировки 7,9 35?
Обучение
11,16,20,24,29,
Полагаться на надежных экспертов 1,2,7,8,10,11 33,38,39/ 8,9,
23,28,31,32*
Обучать с детства — 6,7

П римечания: Ключ к исследованиям идет за примечаниями. Манипу­


ляции, которые оказались, по крайней мере, частично успешными, отме­
чены жирным шрифтом. Те, которые все еще необходимо проверить эмпи­
рически, или результаты которых неясны, помечены вопросительным
знаком. Записи с индексомаперед разделом — это исследования с участи­
ем экспертов, не получивших тренировку по калибровке; записи после вер­
тикальной черты — исследования, использующие различные уровни слож­
ности.

Ключ к исследованиям

Ретроспективные предубежде­ 11. G. W ood (1978)


ния
1. A rkes, W ortm ann, Saville,& Чрезмерная уверенность
H arkness(1981) 1. Adam s & A dam s (1958)
2. D etm er, Fryback, & G assner 2. Adam s & Adams (1961)
(1978) 3. A lpert & R aiffa (1969,21)
3. Fischoff (1975) 4. A rm elius (1979)
4. Fischoff (1977b) 5. Becker & G reenberg (1978)
5. Fischoff (1980) 6. B eyth-M arom & D ekel (in
6. Fischoff & B eyth (1975) press)
7. M itchell & Kalb (in press) 7. Cavanaugh&Borcovsky (1980)
8. Pennington, R u tte r, M cKen­ 8. Clarke (1960)
na, & M orley (1980) 9. Cocozza & Steadm an (1978)
9. Slovic & Fischoff (1977) 10. Dawes (1980)
10. W o h lstetter (1962) 11. D owie(1976)
498 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
12. F errel & McGoey (1980) 24. Moore (1977)
13. Fischoff & Slovic (1980) 25. M orris (1974)
14. F isc h o ff, S lovic, & L ich­ 26. M urphy & W inkler (1974)
ten stein (1977) 27. M urphy & W inkler (1977a)
15. Howell & B u rn ett (1978) 28. N ic k e rso n & M cG oldrik
16. H ynes & V anm arcke (1976) (1965)
17. K ing, Zechm eister, & Sha- 29. Oskamp (1962)
ughnessy (in press) 30. Phillips & W rig h t (1977)
18. K oriat, L ichtenstein & Fisc­ 31. P ickhardt & W allace (1974)
hoff (1980) 32. P itz (1974)
19. Larson & Reenan (1979) 33. R oot (1962)
20. L ic h te n s te in & F isc h o ff 34. S c h a e fe r & B o rc h erd in g
(1977) (1973)
21. L ic h te n s te in & F isc h o ff 35. Seaver, von W in terfeld t, &
(1980b) Edw ards (1978)
22. L ic h te n ste in & F isc h o ff, 36. Selvidge (1980)
P hillips (Глава 22) 37. Sieber (1974)
23. Ludke, S tauss, & G ustafson 38. Stael von H olstein (1971a)
(1977) 39. Stael von H olstein (1972)
40. Tversky & K ahnem an(1974)
Ошибочно понятые задачи. К ак бы тщ ательно ни описывалась задача рес­
пондентам, все ж е останутся некоторые сомнения относительно того, дей­
ствительно ли они поняли ее и приняли заданную структуру поощ рения.
Стандартный маневр для проверки того, “сработала” ли м анипуляция - это
посмотреть, останутся ли участники при своих ответах, которые они уже
дали, если эти ответы используются в новой задаче со структурой поощре­
ний, заданной для старой задачи.
Fischoff, Slovic и L ichtenstein (1977) приняли эту стратегию , спраш ивая
людей, будут ли они готовы осуществить рискованное предприятие, осно­
ванное на оценке уверенности, которую они только что сделали. Это риско­
ванное предприятие будет для них благоприятно, если оценка была искрен­
ней или имела тенденцию недооценить их уверенность, но оно покарает их,
если они, из-за какой бы то ни было причины, преувеличили свои знания.
Н амеренное преувеличение мож ет, например, служ ить альтернативной
цели действовать более осмотрительно, чем это есть на самом деле. Такие
испытуемые определенно стремились принять рискованное предприятие,
несмотря на то, что были такж е чрезмерно уверены, к ак и испытуемые, на­
блюдавш иеся где-либо еще.
Ещ е одно основание для утверж дения, что испытуемые поняли задачу
иначе, неж ели было задано экспериментатором, идет от наблюдения, что
“степени определенности часто использую тся в повседневной речи (как упо­
м инания о погоде), но они редко вы раж ены численно, и часто нет возмож­
ности валидизировать и х.... Неспособность людей оценить соответствующим
образом 0,80 вероятности может быть не более удивительна, чем сложность,
Освобождение от предубеждения 499
с которой они могут столкнуться при оценивании яркости свечей или темпе­
ратуры в градусах по Ф аренгейту” (Fischoff и др., 1977, с. 553). Одним отве­
том относительно этой возможности является ограничение внимания к пре­
делам ш калы вероятности в убеждении, что “100% уверенность, что утверж­
дение правильно, охотно понимает большинство людей, и его уместность охот­
но оценивается” (Fischoff и др., 1977, с. 553). Второй ответ — обеспечение
вербальных ярлы ков для количественных вероятностей, чтобы сделать их
более легкими для понимания (например, Глава 21; Larson & R eenan, 1979).
Ни одна из манипуляций не оказалась по настоящему эффективной. В утвер­
ждениях, что “неопределенность” сама по себе может иметь различные ин­
терпретации, не все из которых являю тся значащими для всех индивидов,
можно обнаружить более глубокое понятие семантического несогласия меж ­
ду экспериментатором и респондентом (Howell & B urnett, 1978; Phillips &
W rig h t, 1977). Эмпирические попытки освобождения от предубеждения,
основанные на этих концепциях, могут оказаться плодотворными.
Наиболее экстремальная чрезмерная уверенность наблюдалась в задачах,
относительно которых респонденты вообще ничего не знали. Х отя экспери­
ментаторы обычно пытаю тся не давать никаких намеков о том, насколько
уверенными следует быть испытуемым, все ж е может иметь место подразу­
меваемое предположение, что “экспериментатор не дал бы мне задачи, ко­
торую невозможно вы полнить”. Если испытуемые имеют подобные ожида­
ния, тогда будет невозможным соответствующ ий уровень уверенности.
Fischoff и Slovic (1980) проверяли эту возможность в серии задач, чье содер­
жание (например, диагностика язв, прогнозирование цен неизвестных ак­
ций) и инструкции были разработаны с целью сделать их каж ущ им ися на­
столько невозможными, насколько это и было в действительности. Однако
чрезмерная уверенность была уменьш ена только (да и то частично) тогда,
когда испытуемых предостерегли, что “может быть совершенно невозмож­
но сделать подобного рода распознавание. П остарайтесь сделать все, что
можете. Но если вы чувствуете, что совершенно не уверены (в своих отве­
тах), без колебаний отвечайте 0,5 (показатель догадки) по каж дому из них”
(с. 752). Любые более сильные инструкции можно было бы подозревать в
том, что они имеют характеристику требования.

Ошибки экспертов
Способные к совершенствованию. Если незначительно изменить интерпре­
тационные полож ения, то последнее упоминавш ееся исследование в пре­
дыдущем разделе может стать первым упоминающ имся в настоящ ем. Уве­
рение испытуемых в том, что они могли допустить, чтобы каж ды й ответ был
просто догадкой, может рассматриваться к ак способ рассеивания какого бы
то ни было остаточного ошибочного понимания задачи или к ак ш аг в сторо­
ну исправления испытуемых, которые понимают задачи, но не себя. Оно
несет подразумеваемое предостережение, что неспособность допустить до­
500 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
гадки мож ет быть проблемой. Это предостережение было явны м в инструк­
ции (Глава 21) испытуемым “разворачивать цепочки” своих субъективных
вероятностных распределений, чтобы избеж ать чрезмерной уверенности.
Отражает ли частичный успех этих манипуляций улучшение понимания или
чувствительность к распоряжениям, пока не ясно. Такая неясность может
объяснить малое количество исследований, принявш их эти подходы.
Это беспокойство о характеристиках требования исчезает в исследовани­
ях намеренной тренировки, где “воздействия экспериментатора” составля­
ют повестку дня. К ак показано в табл. 2, различные попытки тренировки
предпринимались с восхитительным успехом, хотя, может возникать беспо­
койство, что недостаточный энтузиазм журналов отражать исследования с
негативными результатами мог уменьшить заметность неудач. Стремление
тренеров делать все возможное для получения эффекта сделало попытки тре­
нировки достаточно сложными манипуляциями, чьи эффективные элемен­
ты в некоторой степени неясны. Некоторыми из условий, изучение которых
более необходимо являю тся: получение обратной связи по большой выборке
ответов, получая информацию о конкретном выполнении задания (а не про­
сто об общей проблеме), и наличие возможности обсуждения отношений меж ­
ду субъективным ощущением неопределенности и ответами о численной ве­
роятности. К собственному удивлению, Лихтенш тейн и Фишхофф (1980b) об­
наруж или, что один цикл тренировок с интенсивной, персонализированной
обратной связью был так ж е эффективен, как долгая серия проб. Неясно, в
какой степени эти различные успехи представляют тренировку, в узком смыс­
ле овладения конкретной задачей (например, изучение распределения отве­
тов, требуемых экспериментатором), или приобретение более общих умений.

Не поддающиеся коррекции индивиды. Нетерпение в тренировочных ис­


следованиях или скептицизм по поводу их всеобщности привели к тому, что
целый ряд исследований приняли ошибочное оценивание уверенности как
неизбежное и сконцентрировались на помощи принимающим решения справ­
ляться с ним. Одни предлагают заменить индивидов группами экспертов, чья
оценка получена при непосредственном взаимодействии или схемой механи­
ческого сбора (например, Becker & G reenberg, 1978; M orris, 1974); другие при­
зывают к либеральному использованию анализов чувствительности всякий
раз, когда в анализе решений поднимается вопрос об оценивании увереннос­
ти (например, Jennergren & Keeney, в печати); тогда как другие предлагают
перекалибровать оценку, используя корректирую щ ий фактор, который по­
казы вает должную степень уверенности оценивающего как функцию налич­
ной степени уверенности (L ichtenstein & Fischoff, 1977). Например, преобла­
дание чрезмерной уверенности может наводить на мысль, что если объявле­
на определенность, то можно трактовать ее как 0,85 ш анса быть правильным.
К несчастью для этой стратегии, люди неправильно калибруют степень своей
чрезмерной уверенности в зависимости от сложности конкретной задачи, с
которой они столкнулись (Lichtenstein & Fischoff, 1977). К ак результат это­
Освобождение от предубеждения 501
го, необходимая калибровка может быть установлена, только если известна
сложность наличной задачи, и есть возможность наблюдения (чрезмерной)
уверенности респондентов в задаче подобной степени сложности, или, по край­
ней мере, возможность предположения отношений между наблюдаемой и
предсказываемой чрезмерной уверенностью (Ferrel & McGoey, 1980).

Несоответствие между экспертами и задачей


Реструктурирование. Исследование калибровки, к ак и некоторые другие
темы в отнош ении суждений, остались относительно изолированными от
основного потока исследований сознания, и звлекая из психологической
литературы больше методологии, чем идей. О тражает ли этот недостаток
контактов обособленность исследований суждений или неадекватное пред­
ставление уверенности в распространенных моделях когнитивны х процес­
сов, он, вероятно, препятствует разработке методов сниж ения чрезмерной
уверенности. Модели процессов должны к ак предлагать более сильные м а­
нипуляции, так и показы вать, почему психофизиологические подходы ра­
ботают или не работают, и насколько хорошо их результаты способствуют
обобщению. Имеющ иеся исследования показаний очевидцев, ощ ущ ения
знания и мета-памяти могли бы при известных обстоятельствах обеспечить
точки соприкосновения (например, G runeberg, M orris & Sykes, 1978).
Одно из возможных направлений помощи лю дям в использовании их
существующих когнитивны х умений более совместимым образом с требо­
ваниями к оцениванию уверенности можно увидеть у K oriat, L ichtenstein &
Fischoff (1980), когда чрезмерная уверенность была уменьш ена при пере­
числении респондентами причин, по которым выбранные ответы могут быть
неправильны ми. П еречисление причин, почему респондент мож ет быть
прав, или назы вание одного основания “за” и одного — “против” выбранно­
го респондентом ответа не дало никакого результата, показы вая, что крити­
ческий элемент — это не просто более усердная работа или больш ая точность,
но и обращение к пам яти иным образом, чем это обычно происходит в зада­
чах оценивания уверенности. Без специфического побуждения “подумай­
те, почему вы можете быть не правы ” люди оказы ваю тся недостаточно кри ­
тичны или даж е стремятся оправдать свой первоначальный ответ. Возмож­
но, аналогичны м образом М акмоен (1979) обнаружил, что 9-ти и 12-ти лет­
ние дети обнаруж ивали непоследовательность в текстовом материале толь­
ко тогда, когда их просили ее оты скать.
Хотя и выдвинутая скорее на практической, чем на психологической основе,
техника фиксированных значений Сивер и других (1978) может рассматриваться
как еще один способ реструктурирования подхода респондента к задаче. Орга­
низация знаний человека вокруг набора значений, предположительно неправиль­
ных, может привести к более полной оценке того, что он знает, чем “трад ицион­
ный” метод фиксированной вероятности, при котором внимание может фокуси­
роваться на наилучшей догадке респондента о правильном ответе.
502 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
Обучение. Я вляется ли исчезновение чрезмерной уверенности косвенным
результатом реального обучения, которое получают эксперты в своей обла­
сти? К ак упоминалось ранее, очевидный способ исследования этого вопроса
при рассмотрении вы раж ений уверенности, сопровождающ их выполнение
реальной задачи, усложнен возможностью того, что реальное давление ог­
раничит беспристрастие эксперта. Н апример, можно найти свидетельства
чрезмерной уверенности в профессиях, где нужно выносить уверенные суж ­
дения, не демонстрируя валидность (например, предсказание изменений в
бирж евы х ценах (D rem an, 1979; Slovic, 1972 с), психиатрическая диагнос­
ти ка опасности (Cocozza & Steadm an, 1978)). Конечно ж е, если с таким и эк ­
спертами консультирую тся (и платят им) в зависимости от уверенности,
которую они внуш аю т, они могут подвергаться искуш ению неправильно
представлять свои реальные знания.
Несомненно, самые значительные попытки обеспечения беспристрастно­
сти предпринимались в случае с синоптиками, чья тренировка часто ясно
поощ ряла их хорошей калибровкой. Выполнение ими задачи великолепно
(например, M urphy & W inkler, 1974,1977а). Относится ли этот успех за счет
тренировки калибрования, или является продуктом их общего профессио­
нального обучения, не ясно. Обзор других исследований, использую щ их
экспертов, не получивш их тренировок калибрования, наводит на мысль,
что подобные тренировки, а не только реальное обучение, являю тся эффек­
тивным методом. Эксперименты, использовавш ие проблемы, извлеченные
из соответствующ их областей экспертизы , но изолированные от давлений
реального мира, обнаружили чрезмерную уверенность у вы пускников пси­
хологического ф акультета (L ichtenstein & F ischoff, 1977), банкиров (Stael
von H olstein, 1972), клинических психологов (Oskamp, 1962), исполнитель­
ны х лиц (M oore, 1977), граж данских инженеров (Hymes & Vanm arcke, 1976)
и нетренированных профессиональных синоптиков (Root, 1962; Stael von
H olstein ,1971a).
Dowie (1976) обнаруж ил хорош ее калибрование в прогнозировании у
ж урналистов, ведущ их колонку лош адиных бегов в газете. Х отя эти экс­
перты не получают ни поощ рений, ни формальной обратной связи, можно
предполож ить, что они получают удовлетворение, делая мониторинг своей
работы изо дня в день, и вознаграждаю т себя хорошей калибровкой. Идею о
том, что нас необходимо тренировать с детства для такого рода само-мони-
торинга, можно найти в недавних предлож ениях по введению в школьную
программу вы несения суждений к ак предмета (например, Beyth-M arom &
Dekel в печати; C avanaugh & Borkovski, 1980). Перспективность таких пред­
положений еще необходимо проверять.
И, наконец, существует довольно узкая форма экспертизы , оказавш ая­
ся наиболее сильным (и наименее интересным) методом уменьш ения чрез­
мерной уверенности. Один из примеров нечувствительности людей к объе­
му своих знаний вы рвж ается в том ф акте, что их средняя уверенность изме­
няется относительно медленно в ответ на изменения сложности задач, с ко­
Освобождение от предубеждения 503
торыми они сталкиваю тся (L ichtenstein & Fischoff, 1977). Типичными па­
рами пропорций правильных ответов и средней уверенности являю тся: 0,51,
0,65; 0,62, 0,74; 0,80, 0,78; 0,92, 0,86. Тогда к ак точность ранж ируется в
пределах 0,41, уверенность изменяется в пределах 0,23. Кривые калибро­
вания, соответствующие этим итоговым статистическим данны м, являю т­
ся, в некотором смысле, одинаково плохими (или ровными); однако, их сте­
пень чрезмерной уверенности отличается значительно. Тогда к ак первые две
пары представляю т чрезмерную уверенность, третья показы вает приемле­
мую общую уверенность, а четвертая — недостаточную уверенность. Эти
примеры взяты у L ichtenstein и Fischoff (1977), но подобная модель была
обнаружена Clarke (1960), N ickerson и McGoldrick (1965), P ickhardt и W allase
(1974)H P itz (1974), к ак и у многих других. В самом деле, любое сравнение
чрезмерной уверенности в различны х условиях должно принимать во вни­
мание сложность используемых задач. В этом свете, превосходство чрезмер­
ной уверенности в литературе отраж ает, в какой-то мере (возможно, есте­
ственную) тенденцию не ставить перед людьми слиш ком легких вопросов.

Резюме
Оценка уверенности, полученная у различны х людей различны ми способа­
ми, почти всегда демонстрировала значительную нечувствительность к сте­
пени их знаний. Х отя все ж е не следует закры вать дверь перед методологи­
ческими манипуляциям и, они оказались относительно неэффективными и
их результаты трудно обобщать. То, что они сделали, это показали, что чрез­
мерная уверенность относительно сопротивляется многим формам исправ­
ления (отличным от изменений в уровне сложности). Ключом к разработке
более сильны х и предсказываю щ их манипуляций могла бы быть значитель­
но больш ая опора на психологическую теорию. Эффективность тренировки
калибровки наводит на мысль, что тщ ательный анализ того, какой уникаль­
ный опыт обеспечивается таким и тренировками, а не профессиональным
обучением, мог бы к ак руководить освобождением от влияния, так и обога­
тить психологическую теорию.

О бсуж дение
Предположив, что рассмотренные здесь исследования были охарактеризо­
ваны точно, и что они исчерпывают (или, по крайней мере, достаточно пред­
ставляю т) совокупность соответствующ их исследований, тогда их общее
сообщение окаж ется довольно успокаиваю щ им для когнитивного психоло­
га. Оба предубеждения оказались умеренно устойчивыми, сопротивляясь
попыткам интерпретировать их к ак артефакты и ликвидировать их “меха­
ническими” манипуляциям и, таким и как принуждение испытуемых рабо­
тать усерднее. Эффективное освобождение от предубеждения обычно вов­
лекало изменение психологической природы задачи (и подхода испытуемых
504 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
к ней). В таких случаях, по крайней мере, некоторой чести заслуж ивает
психологическая теория. Н апример, гипотеза о том, к ак люди восстанавли­
вают информацию из пам яти, прежде чем оценить уверенность, руководи­
ла м анипуляцией K oriat и других (1980) этого восстановительного процес­
са. Д аж е тренировочная программа “забрасывания испытуемого всем” была
основана на хорошо проверенных и общеприменимых принципах обучения.
Это излож ение следует сопровождать несколькими концептуальны ми
протестами (в дополнение к методологическим, которыми оно открылось).
Одно состоит в том, что различие между артефактной и методологической
м анипуляциям и может быть менее ясным, чем было сказано здесь. Н апри­
мер, увещ евание людей работать старательнее было бы артефактной мани­
пуляцией, если бы оно коренилось в утверж дении, что более непреднаме­
ренные инструкции не вызываю т “реального поведения”. Однако если бы
исследователь мог выдвинуть основательную гипотезу о том, к ак различ­
ны е инструкции воздействуют на процессы суж дений, артеф акт стал бы
главны м следствием с отдельными предсказаниями реального поведения в
ситуациях с и без определенных увещ еваний.
Второй концептуальны й протест состоит в том, что, когда мы подвергаем
сомнению реальность предубеждений, это может налож ить ограничения и
сделать непродуктивным психологическое исследование. В продолжение
примера из предыдущего абзаца, в ж изни есть к ак несерьезные ситуации,
так и ситуации, где следует работать усердно; внутренне ни одна из них не
реальнее, чем другая. Кроме того, относительная валидность несерьезных
и “усердны х” ситуаций в лабораторных экспериментах зависит от ситуа­
ций реального м ира, на которые долж ны экстраполироваться их результа­
ты . У каж дой есть свое место. Понимание соответствия лаборатория-мир
требует хорошего суж дения для характеристики обоих контекстов. Н апри­
мер, ситуации с усердной работой не обязательно синонимичны важ ны м си­
туациям . Люди могут не работать усердно по важным проблемам до тех пор,
пока не осознают к ак центральность суж дений по результатам проблемы,
так и потенциальную ошибочность этого суж дения.
И спользование исследований по освобождению от предубеждения для
того, чтобы откры ть пограничные условия наблю дения предубеждений,
ведет к третьему концептуальному протесту. В этом обзоре итоговые табли­
цы косвенным образом приписали равны й вес различны м исследованиям,
точно определенны м, возмож но, некоторы м понятием окончательности
каж дого исследования (компетентностью, экстенсивностью и т.д.). Такое
совпадение статистически значимы х и статистически незначимых резуль­
татов является сомнительной процедурой, будучи построенной только лиш ь
на методологической основе (например, Hedges & OBcin, 1980). Она стано­
вится концептуально сомнительной, когда начинаеш ь сомневаться относи­
тельно того, адекватно ли сделана вы борка возможных исследований. В та­
к и х случаях собранные данные составляю т концептуально зависимое на­
блюдение, и им не нужно присваивать равны й вес. Любое излож ение того,
Освобождение от предубеждения 505
как ведут себя люди, нуждается в тщ ательном определении подмира пове­
денческих ситуаций, по которым будет производиться выборка исследова­
ний. Н апример, некоторые критики обвиняли ранние исследования эври­
стики суж дений в том, что они “искали неприятностей” в смысле поиска
(вы хваты вания) ситуаций, в которых люди вели бы себя ошибочным обра­
зом. Если это утверждение правильно, тогда не нужно интерпретировать
каждую демонстрацию поведения, подверженного предубеждению, к ак бой­
котирование общей способности людей к суждениям; его уместность огра­
ничена к такому роду ситуаций, какие изучались (или чрезмерно изучались)
в тех экспериментах. Ф окусируясь на пограничны х условиях для оценива­
ния предубеждений, большинство современных исследований подвержено
собственному предубеждению выборки, которое необходимо рассмотреть в
ходе обобщения их результатов.
Таблица 3. Мир рассуждений о предубеждениях и попытках освобождения
от предубеждений.

1. Лежащие в основе процессы, о которых требуется сделать выво­


ды, являются вероятностными. То есть, суж дения вы носятся в ус­
ловиях неопределенности, с предубеждениями, вытекаю щ ими из
конфронтации между детерминистским умом и вероятностным ок­
руж ением.
2. Проблемы возникают в интеграции, а не в обнаружении свиде­
тельств. Х отя стимулы являю тся полными и недвусмысленными,
насколько это возможно, они не много говорят о том, как может быть
структурирована задача. Задача испытуемого состоит в интерпре­
тации и использовании той информации, которая обеспечивается.
3. Предубеждения являются не связанными с существом проблемы.
Действие когнитивного процесса с данной информационной струк­
турой должно быть одинаковым в любой содержательной области. Это
ликвидирует “ошибки” вследствие неправильной информации и “не­
правильные концепции” вследствие намеренного обмана.
4. В наличии некоторая нормативная теория, характеризующая
соответствующее суждение. Этот критерий выводит проблему из
области предпочтения (например, противоречивые отнош ения), где
ни один ответ не может определяться как оптимальный.
5. Не предлагается и не позволяется никакая помощь в вычислени­
ях ( кроме карандаша и бумаги). Этот фокус на интуитивны х суж ­
дениях исклю чает такую помощ ь, как ручные калькуляторы , кон­
сультанты по статистике и интерактивны е компью теры.
6. Нет никаких очевидных побуждений к субоптимальному пове­
дению. То есть предубеждения когнитивны , а не мотивационны по
природе. Суть исследования предубеждения состоит в том, конечно
ж е, что там, где у людей нет весомой причины действовать субопти-
506 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
мально, ош ибки наводят на мысль, что они просто не знаю т, к ак дей­
ствовать лучш е.

Д альнейш ие вопросы
Вопрос, возникнут ли подобные модели по другим видам предубеждений,
требует обзора аналогичной литературы . Таблица 3 предлагает характерис­
тику сферы предубеждений, внутри которой могут разы скиваться повторя­
ю щ иеся модели, отличая содержание этого издания от других предубежде­
ний, причинявш их беспокойство психологам.
Затягиваю щ ийся мета-вопрос, обращ енный к таким обзорам, это: Н а­
сколько хорош и люди? Я вляю тся ли они когнитивны ми калекам и или зна­
токами? Чтобы дать один ответ, необходимо ответить на невесомые вопро­
сы о природе ж изни и общем сходстве ж изненного опыта людей с лабора­
торными условиями. У клончивый момент настоящ его обзора состоит в том,
что резервуар умений по вынесению суждений у людей к ак наполовину пуст,
так и наполовину полон. Люди достаточно умелы, чтобы прож ить, доста­
точно неумелы, чтобы соверш ать предсказуемые и последовательные ошиб­
ки ; они достаточно умны , чтобы изобрести ш ироко и легко применимую
эвристику, которая часто хорошо им служ ит, достаточно неискуш енны ,
чтобы не осознать пределов такой эвристики. Более специф ическая оценка
способности людей может быть дана только в контексте конкретной задачи
по вынесению суж дения. Такие общие утверж дения (или отговорки) о “лю­
д ях ” отраж аю т общую черту исследований суждений — отсутствие интере­
са к индивидуальным различиям . Х отя это предпочтение групповых резуль­
татов мож ет быть просто делом вкуса, оно может быть оправдано теорети­
чески утверж дением, что главны е результаты в исследованиях суждений
так обш ирны и использую тся так неадекватно, что индивидуальные разли­
ч и я могут подож дать. Некоторую эмпирическую поддержку этого утверж ­
дения обеспечивает довольно скудное понимание, являю щ ееся результатом
исследования групп с известными характеристиками. Особенно поразитель­
ным было отсутствие различий в экспериментальны х исследованиях наи­
более логичны х из известны х групп — эксперты , выносящ ие суж дения в
своих областях экспертиз. Случайные и полученные в ходе изучения про­
блемы свидетельства, собранные Dawes (1976), Eddy (Глава 18, этого изда­
н ия), F isher (1970) и другими, такж е показы ваю т, что экстенсивная трени­
ровка и вы сокие ставки — не гарантия успехов в суж дениях. Тем не менее,
необходимо дальнейш ее исследование, к ак из-за твердости, с которой мно­
гие уверены, что эксперты лучш е, так и из-за прикладного значения исполь­
зования экспертного суж дения с большим преимущ еством.
Д ля непосредственной практической цели наилучш его использования
экспертов так, чтобы избеж ать предубеждения, достаточно знать, лучш е ли
они, чем непрофессионалы, или, по крайней мере, лучш е ли осознают свои
ограничения в суж дениях. Д ля окончательной практической цели освобож­
Освобождение от предубеждения 507
дения всех судей от предубеждений очень важ но знать, к ак эксперты оказа­
лись на том этапе, где оказались, или почему они не пош ли дальш е. Далее
следует перечень условий, которые обычно сопровождают изучение. Д ля
каждого показаны способы, при которы х эксперты могут быть в особенно
выгодном или невыгодном полож ении, в зависимости от обстоятельств:

1. Обильная практика с набором умеренно однородных задач. У


экспертов должен быть такой опыт. Они могут использовать его, что­
бы оттачивать свои умения выносить суждения, или могут разраба­
тывать ситуативно-специфические привычные решения, освобождая
себя от необходимости анализировать (и думать).
2. События критерия точности. Хотя от эксперта часто требуют до­
статочно точных суждений, объекты таких суждений являю тся часто
компонентами таких сложных (природных, социальных или биоло­
гических) систем, что трудно оценить уровень понимания судьи. Суж­
дения, не попавшие в цель, могут появляться из-за непредвиденных
случайностей, тогда как суждения, попавшие в цель, могут быть пра­
вильными согласно ошибочным доводам.
3. Специфичное для задачи подкрепление. Экспертам, в принципе,
оплачивается их работа. Однако, даже когда видна мудрость их суж­
дений, они могут получить поощрение на другой основе (например,
принесли ли они хорошие известия? разрушили ли они планы? изме­
нится ли все к лучшему?).
4. Точное принятие необходимости обучения. Становится учеником
какой-либо программы, которая присуждает право экспертизы, - это,
несомненно, признак скромности. Тем не менее, на каждой стадии этого
процесса и профессиональной ж изни, следующей за ним, определен­
ные преимущества у тех, кто демонстрирует хорошие манеры и про­
являет компетентность.

Существуют вполне оперантные принципы обучения, манипулирующие пове­


дением без предположения каких бы то ни было знаний о лежащ их в его основе
когнитивных процессах. Прояснение и эксплуатация этих процессов являет­
ся, очевидно, главной теоретической и практической задачей для исследова­
ний по освобождению от предубеждений, особенно когда подобные манипуля­
ции рассматриваются как имеющие в какой-то мере лучший послужной спи­
сок, чем более механические попытки. Хотя исследование предубеждений и
освобождения от них преодолело достаточно большую часть пути от основного
исследования до применения в полевых условиях, ему все ж е еще необходимо
адекватно приблизиться к основам с обеих сторон. Уже сейчас очевидно, что
достижение одного конца будет требовать достижения другого. Хорошая прак­
тика будет требовать лучшей теории о том, как работает мышление. Хорошая
теория будет требовать лучшей практики, проясняющей и пытающейся выяс­
нить условия, в которых мышление действительно работает.
32. Улучшение индуктивного вывода*

Р и ч а р д Н и с б е т т , Д э в и д К р а н ц , К ри ст оф ер
Д ж еп сон и Д ж еф ф ри Т. Ф онг

В этой главе мы обсудим возможность улучш ения выводов, которые люди


делаю т в повседневной ж изни. Нисбетт и Росс (N isbett и Ross, 1980) предпо­
лож или, что улучш ений можно достичь благодаря тому, что инструмента­
рий ученого по формированию заклю чений становится доступным непро­
фессионалу в форме аксиом, таких как “Это эмпирический вопрос” или “Все­
гда мож но объяснить исклю чения”. Мы обратимся к “статистическим эв­
ристикам ” за одним из наиболее важ ны х неформальных руководств по рас­
суждению , такому к ак “Подумай об одном свидетельстве, к ак если бы это
бы ла вы борка, и поразм ы ш ляй о размере этой выборки”. Мы уверены, что
такие грубые руководства по выводу заклю чений, помещенные в матрицу
понимания статистики и теории вероятности и поддерживаемые опытом
прим енения эвристики в реальны х проблемах, могут оказаться очень цен­
ными в отнош ении уменьш ения ошибок вывода в повседневной ж изни.
М ожно быть систематичным в исследовании того, что может произойти
при использовании такой программы, и где вероятнее всего можно натолк­
нуться на слож ности. Мы уверены, что сейчас видны три такие сложности,
и мы уверены , что попы тки реш ения каж дой из этих проблем принесут ди­
виденды в смысле улучш ения понимания к ак того, к ак люди делают выво­
ды , так и того, к а к им следует это делать.
1. М ожет быть очень сложно установить, что данный сомнительный вы­
вод на самом деле ошибочен. В большинстве работ Канемана и Тверски, веро­
ятностные модели, являю щ иеся основой предписанных выводов, являю тся
стандартными статистическими моделями, и их применение к рассматрива­
емым событиям неоспоримо. В то время к ак социально-психологическая ра­

* Написание этой статьи и некоторые из исследований, о которых в ней идет речь, были
частично поддержаны грантом BNS 79-14094 Национального фонда науки. Мы благода­
рим Ли Росса, Сауля Ш тернберга и Поля Тагада за комментарии к более раннему варианту
статьи.
Улучшение индуктивного вывода 509
бота в этом русле продолжается, становится все более ясно, что может быть
очень сложно точно знать, к акая модель для событий является правильной
и, таким образом, знать, для чего требуются процедуры вывода.
2. Д аж е если можно быть достаточно уверенным, что произош ла ошиб­
ка, очень не просто узнать, как она произош ла. Трудно узнать, относится
ли ош ибка насчет ошибочного рассуж дения, то есть, скудны х процедур
вывода, или насчет неправильны х моделей, то есть, неверных предш еству­
ющих убеждений о природе рассматриваемых событий.
3. Д аж е если мы достаточно уверены в соответствующих моделях, у нас
может не бы ть очевидных полезны х руководств по выводу. В настоящ ее
время мы не имеем представления о том, к ак перевести некоторые из наибо­
лее фундаментальных статистических размыш лений в руководство по рас­
суждениям в повседневной ж изни. Это выступает особенно явно в примере
размыш лений о предубеждении выборки. Люди склонны уделять слиш ком
мало внимания возможности того, что свидетельство подверглось предубеж­
дению, но еще далеко до понимания того, к ак ая “статистическая эвристи­
ка” будет соответствующей для использования в большинстве проблем ре­
ального мира.

М одели и э в р и с т и к а в и н д у к ти в н о м р ассу ж д ен и и
Давайте начнем наш е обсуждение ошибочного индуктивного рассуждения с
анализа примера, в котором отсутствуют сложности, на которые мы только
что ссылались. Многие из примеров в этой книге подошли бы, но проблема
родильного отделения в работе Канемана и Тверски (1972,3) особенно точна
и поможет нам установить некоторые определения. Испытуемых попросили
составить мнение о том, в большой или в маленькой больнице будет большее
число дней в году, когда более 60■> новорожденных будут мальчиками. Боль­
шинство испытуемых отметило “примерно одинаковое”, из оставш ихся око­
ло половины отметили “в большой” и около половины - “в маленькой”. Дру­
гими словами, к ак группа, испытуемые были уверены, что подобные откло­
няющ иеся дни, когда рождение мальчиков превысит 60% , будут в равной
степени вероятны как в большой, так и в маленькой больнице.
Канеман и Тверски предположили на основе этого и многих других экс­
периментов, что преобладающий способ рассуж дения, ведущ ий к этому ре­
зультату, — это использование эвристики репрезентативности. И спыту­
емые, использующ ие эту эвристику, будут фокусироваться на различии от­
клоняющ егося результата (60% ) от предполагаемого типичного исхода (око­
ло 50% для этого случая). Поскольку на степень сходства, или “репрезента­
тивность”, не влияет размер больницы, испытуемые будут считать вероят­
ность отклоняю щ егося результата одинаковой для обеих больниц.
Однако, при правильном подходе к этой проблеме, мы обращаемся к дей­
ствительным подгруппам “муж ских” и “ж енских” исходов в любой из дней в
одной больнице, как к случайной выборке из совокупности 50 - 50. Затем
510 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
следует, из биноминальной формулы или закона больших чисел, что откло­
няющ ийся процент выборки менее вероятен при большем размере выборки. Зак­
лючаем, исходя из применения вероятностной модели, что д ни, когда рождает­
ся 60 или более процентов мальчиков менее вероятны в большой больнице.
В этом примере рассуждение, основывающееся на интуитивной эврис­
тике (эвристике репрезентативности), противопоставлено рассуж дениям,
осущ ествляю щ имся внутри математической модели. Мы выносим норма­
тивное суж дение, кри ти куя интуитивное суж дение к ак ошибочное, по­
скольку было получено отличное от него заклю чение по модели, которая,
к а к мы уверены , является подходящ ей репрезентацией для пола новорож­
денны х. Н аш а процедура по вынесению нормативного суж дения на основе
модели иллю стрирует основной принцип: Индуктивное размышление дол­
жно быть оправдано в терминах уместности основных моделей рассмат­
риваемых событий.
М атематическая модель — лиш ь один вид модели, притом редко исполь­
зуемый в разм ы ш лениях людей: она требует математической тренировки и
огромного количества времени для размы ш лений. Но мы будем использо­
вать термин модель в отношении любой частичной репрезентации некото­
ры х аспектов действительности. Мы вклю чаем сюда ф изические модели
(например, модель самолета, сделанная в масш табе), математические моде­
ли (например, уравнения, описываю щ ие воздушную струю над кры льям и
самолета) и, более обобщенно, интуитивные концептуальны е модели. Это
есть умственные репрезентации людей о самолетах, или воздушной струе,
или процессах, определяю щ их пол новорожденных, или о любых других
аспектах действительности. Предельно важ ное различие среди моделей ле­
ж и т меж ду теми, которые являю тся чисто детерминистскими (то есть, они
не содерж ат репрезентации непредсказуемости), и теми, которые являю тся
вероятностными (то есть, они вклю чаю т предположение, что события не­
достаточно предсказуемы , учиты вая стандартные условия информации).
Вероятностные модели могут быть физическими (выбрасывание игральны х
костей или вы тягивание камуш ков из урны) или математическими (слу­
чайны е переменные), но часто они менее точны. Н апример, человек, наблю­
даю щ ий пры ж ки в длину может быть убежден, что следующий участник
соревнования пры гнет где-то на 8 метров, но пры ж ок короче или длиннее
не будет удивительны м, и пры ж ок даж е на 7,5 или 8,5 метров будет такж е
возмож ны м. Эта умственная репрезентация о пры ж ках в длину является
интуитивной вероятностной моделью, вклю чаю щ ей умственное “типичное
расстояние” и , своего рода, “ошибочное распределение”, которое дает откло­
нения от типичного.
Природа модели событий имеет критическое значение для отбора исполь­
зую щ ихся инструментов вывода, вклю чаю щ их разнообразную эвристики.
Эвристика — это любой руководящ ий принцип трансформирования инфор­
мации с целью реш ения проблемы или формирования суж дения. Мы уж е
упоминали эвристику репрезентативности, но н а самом деле она вклю чает
Улучшение индуктивного вывода 511
два различны х вида эвристики: один для построения моделей (согласно эв­
ристике репрезентативности, основная модель долж на близко соответство­
вать структурным особенностям наблюдаемых данны х), а другой для оце­
нивания вероятности исходов (исход более вероятен, если его структура бо­
лее сходна со структурой предполагаемой основной модели). Статисти­
ческая эвристика поощ ряет дум ать об инф орм ации в терм инах таки х
свойств данны х, к ак надежность и валидность, и манипулировать инфор­
мацией, используя вероятностные концепции, такие как базовое значение.
Если имеется основная вероятностная модель для событий особого типа, то,
вероятно, при рассуждении об этих событиях будет использоваться статис­
тическая эвристика.
Давайте определимся, к ак применяю тся эти концепции моделей и эври­
стики в проблеме родильного отделения. Д ля полностью удовлетворитель­
ного реш ения этой проблемы использовалась бы м атематическая модель —
модель случайной выборки из совокупности 50 - 50. Больш инство испыту­
емых, возможно, используют слиш ком простую модель пола новорожден­
ных — модель, которая определяет разделение 50 -5 0 , но не вклю чает ника­
ких отнош ений между случайностью процессов осущ ествления выборки и
возможной ош ибкой этого осущ ествления. Несомненно, большинство ис­
пытуемых знаю т что-то об отнош ениях между размером выборки и ош и­
бочностью осущ ествления выборки, но это знание не включено в интуитив­
ную модель, которую они умственно установили, чтобы реш ить проблему.
Вместо этого они дополнили простую модель 50 - 50 репрезентативной эв­
ристикой, которая привела их к заклю чению , что 60% рождений м альчи­
ков в какой-то степени маловероятно, но в равной степени для обеих боль­
ниц. Заметим, что испытуемым не нужно быть статистикам и, чтобы реш ить
эту проблему, по крайней мере, качественным способом. Если их модель
наблюдаемого отнош ения полов вклю чала интуитивное понятие осуществ­
ления выборки, то они могли бы использовать статистическую эвристику.
В этом случае, необходимой эвристикой будет понятие, что большие выбор­
ки с больш ей вероятностью будут иметь репрезентативную или типичную
структуру, чем маленькие выборки.
В кратце, размы ш ление основано на моделях. В зависимости от своей
модели человек мож ет использовать различны е алгоритмы эвристики. Ма­
тематики могут выводить количественные следствия на основе математи­
ческих моделей; люди с интуитивной моделью осущ ествления выборки мо­
гут успешно использовать статистическую эвристику; а люди со слиш ком
простыми моделями могут использовать репрезентативную эвристику и, по
крайней мере, в этой проблеме, будут вводиться ею в заблуждение.

П р и м ен ен и е в е р о я тн о стн ы х м о д ел ей в п о в сед н ев н ы х в ы в о д ах
Н еудача использования вероятностной и статистической эвристики стано­
вится причиной ошибок не только в ответе на загадки типа проблемы ро­
512 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
дильного отделения; она такж е влияет на выводы людей в повседневных
ситуациях, особенно в социальной сфере. Росс (Ross, 1977) предположил,
что люди совершают фундаментальную ошибку атрибуции: они склонны
приписы вать поведение других людей личным наклонностям, не замечая
ситуативны х причин или временных внеш них влияний на поведение. Мы
дадим два примера этой ош ибки и покаж ем, к ак рассмотрение вероятност­
ны х моделей помогает нам определять такой тип ошибок.
Нисбетт и Боргида (N isbett и B orgida, 1975) показали, что испытуемые
часто неспособны использовать информацию “консенсуса”: они подразуме­
вают идиосинкразические, личны е наклонности для поведения конкретно­
го индивида, даж е если их проинформировали, что больший <гео других
людей в подобной ситуации вели себя сходным образом. Н апример, в одном
исследовании испытуемые оценивали “Грега Р .” как равнодуш ного и ж ес­
токого человека, потому что он не приш ел н а помощь “ж ертве”, у которой,
к ак он был уверен, был приступ. Тенденция давать “Грегу Р .” такие нега­
тивны е оценки была высокой к а к у испытуемых, которым дали информа­
цию консенсуса, а именно, что большинство людей в идентичной ситуации
не оказали помощи ж ертве, так и у испытуемых контрольной группы, ко­
торым не давалась подобная инф ормация консенсуса, и которые, таким об­
разом, были уверены, что большинство людей помогли бы ж ертве.
К ак люди могут выгодно использовать информацию консенсуса, чтобы
см ягчить свои выводы о личны х чертах или склонностях? Нам каж ется,
что некоторы е социальные психологи, которые все ж е делаю т акцент на
ситуационны х детерминантах поведения, оперируют при помощи интуи­
тивной (а порой даж е формальной) вероятностной модели, в которой неко­
торые ситуации ведут к высокой вероятности определенного поведения по­
чти для всех индивидов, тогда как некоторы е индивиды могут обладать
высокой вероятностью о п р е д е л е н н о е поведения почти во всех ситуациях.
По структуре, предлагаемой подобной моделью, инф ормация консенсуса
легко интерпретируется к ак свидетельство того, что конкретная ситуация
бы ла высоко вероятной, и , следовательно, возникновение подобного пове­
дения не является хорошим свидетельством того, что данный индивид об­
ладает высокой вероятностью такого поведения в других ситуациях.
Мы считаем, что вероятностные модели такого типа являю тся хорошей реп­
резентацией социального поведения, и они обеспечивают основание для кри­
тики выводов, которые не использовали выгодно информацию консенсуса.
Испытуемые в исследовании Нисбетта и Боргиды, возможно, полагались ис­
ключительно на репрезентативную эвристику, конструируя модель целевого
человека, который будет соответствовать данным: Грег Р. жестокий и равно­
душ ный, потому что его действия каж утся жестокими и р -внодушными.
В этом примере, к ак и в случае с проблемой родильного отделения нет
слиш ком большого соблазна защ ищ ать выводы испытуемых. Ч истая мо­
дель черт социального поведения, без какого бы то ни было ситуационного
влияни я на вероятность, не является очень разумной, и сами испытуемые,
Улучшение индуктивного вывода 513
наиболее вероятно, допустили бы то ж е самое. Наш второй пример того, чего
мы могли бы придерж иваться, в качестве случая фундаментальной ошиб­
ки атрибуции, однако, ведет даж е к большим спорам.
П редположим, что кандидату н а значительную административную дол­
ж ность предлож или встречу н а основании очень хорошей рекомендации
предыдущ их работодателей. Встреча началась с группового ланча, во вре­
м я которого кандидат демонстрировал нервное поведение. Позднее некото­
рые из присутствовавш их н а ланче людей сказали, что кандидату недостает
необходимых для работы межличностных умений.
Социальный психолог мог бы сказать, что вывод работодателей о “м еж ­
личностных ум ениях” сомнителен. Ситуативное объяснение наруш аю щ е­
го правила поведения (вклю чая требования обстановки ланча-встречи) или
вероятностная интерпретация (он вел себя не так, к ак обычно) могли бы быть
правдоподобными, и, в самом деле, в свете рекомендаций предыдущих ра­
ботодателей каж утся более правдоподобными, чем объяснение в терминах
умений кандидата. Но работодатель мог бы ответить, что каж ды й, кто не в
состоянии демонстрировать равновесие в ситуации ланча-встречи, тот ве­
роятно, потерпит неудачу в других ситуациях, связанны х с работой, кото­
рые в равной степени требуют равновесия.
Очень сложно опровергнуть этот довод. Работодатели оправдали свой
вывод в терминах модели, которая постулирует высокую статистическую
ассоциацию между неудачей в одной ситуации и неудачей в других ситуа­
ц иях, сходных с первой по некоторым переменным, хотя по другим - нет.
Трудно узнать, вовлекал ли действительный когнитивны й механизм, ле­
ж ащ ий в основе первоначального вывода, использование подобной модели
или вместо этого просто полагался на эвристику репрезентативности (рас­
сматривая сходство между поведением кандидата во время ланча и прото-
типным поведением во время ланча стереотипного идеального кандидата).
И такж е трудно знать наверняка, что предложенная работодателями модель
неверна. Социальный психолог знает по опыту, что подобная корреляция
обычно очень слаба при эмпирической проверке; но эта конкретная корре­
л яц и я не проверялась непосредственно, и чтобы проверить ее, применив
сущ ествую щ ие психологические техники, потребовалось бы невероятно
подробное и недопустимо дорогое исследование.
Эти примеры иллю стрирую т два различны х способа, когда индуктивное
размы ш ление мож ет быть ошибочным, и они указы ваю т на два различны х
вида нормативных советов или обучения, которые могут потребоваться, (а)
Иногда процедуры вывода ошибочны. Иногда люди могут соглаш аться (по
крайней мере, после размы ш ления) с тем, к ак ая модель приемлема, но на
практике могут использовать другие, более простые модели и , соответствен­
но, легкую эвристику. Нормативный совет делает акцент на избегании чрез­
мерного упрощ ения и слиш ком легкого использования эвристики репрезен­
тативности. Ц ели обучения вклю чаю т обучение моделям обширной полез­
ности, таким к ак биномиальная модель осущ ествления выборки, обучение
514 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
конкретному применению этих моделей, и подчеркивание статистической
эвристики, которая мож ет иногда зам енять строгое дедуктивное рассужде­
ние в моделях, (б) Иногда рассуждение по данной модели правильно, но сама
модель сомнительна или даж е демонстративно неправильна. Нормативный
совет подчеркивает, что известно (например, о слабости определенных ти­
пов поведенческих корреляций), что может делать конкретную модель пред­
почтительнее.
Этот анализ такж е указы вает на два очень серьезных пробела в доступнос­
ти нормативного совета. В некоторых случаях у нас могут отсутствовать зна­
ния, необходимые для формулирования адекватных моделей. В других слу­
чаях, у нас может не быть достаточно легкой и подходящей статистической
эвристики. Образец информации консенсуса иллюстрирует пробелы в совре­
менных проблемах социальной науки. Мы можем критиковать испытуемых,
которые не использовали информацию консенсуса вообще, но предполагаем,
что испытуемые ответят: “Да, вы правы , ситуативные факторы являю тся
релевантными; а теперь скаж ите нам, насколько мы должны исправить наш е
убеждение о равнодуш ии Грега Р. с точки зрения того ф акта, что большин­
ство людей вели себя подобным образом?” Чтобы ответить на это, необходима
была бы теория взаимодействия черт / ситуаций, которую специалисты по
психологии личности и социальные психологи до сих пор не дали.
Д емонстрация того ф акта, что у нас нет определенной существенной ста­
тистической эвристики, требует своего раздела.

Р егу л и р о в ан и е вы вод а д л я п редубеж ден и я вы борки: Н еобходи ­


м о сть с та т и с т и ч е с к о й эв р и с ти к и
П равильны е процедуры для учета размера выборки при выведении заклю ­
чений хорошо разработаны , поскольку больш ая часть статистической тео­
рии посвящ ена проблемам такого рода. Частично, к ак следствие, мы не пред­
видим особых сложностей в обучении людей быть более чувствительными к
рассмотрению размера выборки в задачах вывода, представленных в повсед­
невной ж изни. Однако когда мы рассматриваем вопросы предубеждения
вы борки, то дела обстоят несколько иначе. К сожалению , к ак доказали Нис-
бетт и Росс (N isbett и Ross, 1980), ош ибки вывода оказы ваю тся с гораздо
больш ей вероятностью результатом предубеждения, чем небольшого раз­
мера вы борки.
В обсуждении проблем, с которыми сталкиваеш ься, пы таясь разработать
эвристику для преодоления предубеждения выборки, будет очень полезно
различать два основных вида информации о выборке наблюдений: инфор­
м ация о процедуре осуществления выборки и информация о типичности
ковариантных черт. В первом виде информации, а именно, о процедуре,
мы будем довольно грубо различать случайные, статистические и иллю ст­
ративны е выборки. Эти термины достаточно быстро вы водят нас из сферы
теоретической статистики, которая рассматривает только одну из катего­
Улучшение индуктивного вывода 515
рий, и толкаю т нас в сферу случайны х наблюдений и взаимодействия на­
блюдаемых фактов.
Случайные выборки - это наблюдения, отобранные из всех возможных
любым наиболее подходящ им способом. Больш инство выводов, не только в
повседневной ж изни, но даже в тщ ательной научной работе, основаны на
случайных выборках. Например, испытуемые, использованные в исследо­
ваниях К анеманаи Тверски, наблюдались потому, что были доступны. Ста­
тистические выборки используют известный вероятностный механизм для
отбора наблюдений из некоторого множества возможных. Они являю тся
единственным видом выборок, для которых возможны строгие статистичес­
кие вы числения. Этот вид осущ ествления выборки преобладает в исследо­
ваниях путем опроса или в проверке контроля качества. Однако, умный ста­
тистик, составляю щ ий модели, мож ет перевести случайную выборку в ста­
тистическую путем формулирования разумной совокупности и вероятност­
ной селективной модели, которая мож ет быть удовлетворена действитель­
ной процедурой отбора. И, наконец, иллюстративная выборка является
механизмом взаимодействия, используемым для увеличения конкретнос­
ти или яркости отчета, основанного на значительно большем объеме дан­
ных. Телевизионные репортажи или ж урнальны е статьи иногда иллю стри­
руют то, что рассматривается к ак характеристики совокупности, исполь­
зуя ярки е единичные случаи. Но даж е в науке больш ая презентация дан­
ных иллю стративна. В электрофизиологии, например, заклю чения, осно­
ванные на фрагментарном наблюдении множества нервных клеток, часто
иллю стрирую тся отчетами по выборке клеток, которые хорошо демонстри­
руют типичные черты.
Другой тип информации о выборке относится к типичности ковариант-
ных черт. Т акая информация вклю чает знания переменных, не являю щ их­
ся главны м интересом, которые могут быть коррелятам и последних, и ко­
торые могут быть сравнены с известными значениями совокупности для
оценки типичности выборки. Рассмотрим пример из повседневной ж изни,
где главная переменная - это доход, а возраст и пол каж дого индивида так­
ж е отмечаю тся. Предположим, мы хотим знать, к ак ая группа зарабаты ва­
ет больше - люди, пиш ущ ие стихи в качестве хобби, или люди, которые
играют на музы кальны х инструментах. У нас есть друг Д ж ек, 50 лет, у ко­
торого много знакомы х (преимущ ественно муж чины среднего возраста),
пиш ущ их стихи, а такж е у нас есть подруга Д ж ейн, 25 лет, у которой много
знакомы х (преимущественно молодые ж енщ ины , играющ ие на м узы каль­
ных инструментах). Распределение доходов у поэтов намного выш е, чем у
музы кантов. Каждый согласится, что это ни о чем не говорит в отношении
двух рассматриваемых совокупностей: выборки атипичны совокупностям
по переменным, которые высоко коррелирую т с доходом (в настоящ ее вре­
мя). Это имеет большое значение в отнош ении того, насколько атипичны
черты выборки, а такж е насколько полезны эти черты для предсказания
значений центральной переменной. Во многих экспериментах Канемана и
516 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
Тверски были использованы в качестве испытуемых учащ иеся израильс­
кой средней ш колы . И все ж е мы и они извлекаем намного более простран­
ные выводы из результатов, поскольку, хотя большинство взрослых людей
не являю тся ни израильтянам и, ни учащ имися средней ш колы , эти черты
считаю тся слабо коррелирую щ ими, если вообще коррелирую щ ими, с цент­
ральны ми переменными в их исследованиях. Д аж е в сконструированной
статистической выборке, следует отметить, долж на рассматриваться ати-
пичность: если в обозрении доходов зарегистрированных демократов была
взята небольш ая случайная выборка с преобладанием белых муж чин сред­
него возраста, то мы не примем стандартные типы выводов, основанные на
случайном осущ ествлении выборки, к ак валидные.
Чтобы урегулировать атипичноеть, статистик, конструирую щ ий моде­
ли , мож ет попы таться более точно сформулировать отнош ения между це­
левой переменной и ковариантами и исправить вывод, используя эти отно­
ш ения. Н апример, можно предположить или оценить отнош ения между
возрастом, полом и доходами и сравнить урегулированные доходы поэтов и
музы кантов. Т акая адаптация требует опы та, размы ш ления и часто коли­
чественны х данны х и умеренно больших выборок (для проверки модели и
оценки параметров).
Мы отм ечали, что случайное осущ ествление выборки или атипичны е
вы борки иногда могут управляться слож ны ми моделями, но неразумно
ож идать от не экспертов управления предубеждением выборки этим спосо­
бом. К акие интуитивные процессы используют обыватели, чтобы исправить
предубеждение выборки? И каки е рекомендации, исходящ ие из практичес­
ки х способов статистика, мы можем дать, чтобы улучш ить их выводы?
К вопросу о том, к ак люди адаптирую т предубеждение выборки, обращ а­
лись в двух исследованиях Х емилл, Вилсон и Нисбетт (H am ill, W ilson и
N isbett, 1980). Общее заклю чение состояло в том, что люди адаптируют очень
слабо: они не показы ваю т н икаких систематических различий между вы ­
водами, сделанными на основе случайны х выборок, в сравнении с вывода­
м и, сделанными н а основе типичны х выборок, и даж е извлекаю т подобного
рода выводы на основе выборок, отмеченных к ак специфически атипичные
(контр-иллю стративны е, к ак это было).
Н екоторые подробности этих исследований могут быть значимы ми, если
читателю необходимо серьезно подумать о том, какую статистическую эв­
ристику следует использовать лю дям. В одном исследовании испытуемые
просматривали видеозапись интервью с подразумеваемым тюремным над­
зирателем, которы й показался очень гуманным одной половине испытуе­
мы х и очень ж естоким - другой. Н екоторых испытуемых привели к убеж­
дению, что представленный единичный случай был иллю стративным для
больш ей выборки тюремных надзирателей. Другим испытуемым было ска­
зано, что этот единичны й случай был контр-иллю стративным: им ясно ска­
зали , что интервью ируемый надзиратель был отобран к ак один из наиболее
крайних (один из наиболее гуманных для тех, кто видел гуманного надзи­
Улучшение индуктивного вывода 517
рателя, и один из наименее гуманных для тех, кто видел жестокого надзи­
рателя). Третьей группе не дали никакой информации об иллю стративнос­
ти, и в результате была представлена случайная выборка единичного раз­
мера. В другом исследовании испытуемые читали ж урнальную статью с
ярким негативны м портретом получателя благотворительного пособия.
Некоторых из испытуемых привели к убеждению, что случай, о котором
они прочитали, был в высокой степени типичным в отношении продолжи­
тельности получения пособия. Им сказали (неправильно), что, к ак большин­
ство получателей пособия среднего возраста, эта женщ ина получала посо­
бие большую часть своей взрослой ж изни. Другим испытуемым сказали
правду об атипичности ж енщ ины в отношении этой черты: их проинформи­
ровали, что большинство получателей пособия получают его только в тече­
ние нескольких лет.
Отношения к тюремным надзирателям вообще (в первом исследовании)
и к получателям пособия вообще (во втором исследовании) были оценены
разнообразными мерами. Отношения к тюремным надзирателям были на­
много более благосклонными в группе, направленной на гуманного надзи­
рателя, чем в группе, направленной на жестокого надзирателя. Это показы ­
вает, что вывод о надзирателях вообще был извлечен из единичного случая.
Отношения к получателю пособия у испытуемых, которые читали ж урналь­
ную статью , были значительно более негативными, чем отнош ения конт­
рольной группы , снова показы вая, что выводы о реципиентах пособия, в
общем, были извлечены из статьи об одном получателе.
В исследовании надзирателей испытуемые, которым сказали, что надзи­
ратель был типичны м, из видеозаписи извлекли выводы, систематично не
отличавш иеся от выводов, извлеченны х испытуемыми, у которых не было
информации о процедуре осущ ествления выборки. Д аж е испытуемые, убеж­
денные, что надзиратель был атипичен, сделали выводы в том ж е направле­
нии, что и другие группы, и в действительности различия между ними и
другими группами не были статистически надеж ны ми. Подобным образом,
в исследовании получателей пособия “типичная” и “атипичная” группы
извлекли сходные выводы, и ф актически наблюдавш ееся различие между
средними значениями их отношений было незначительным.
Очень важно для нашего последующего нормативного анализа поразмыш­
лять о том, к а к можно объяснить эти результаты в терминах когнитивных
процессов. Результаты довольно неож иданны , если предполагается, что у
испытуемых имею тся определенные предшествующие отнош ения, сформи­
ровавш иеся прош лым опытом и информацией, к получателям пособия и
тюремным надзирателям . Сильное воздействие на такие предшествующие
отнош ения о совокупности может быть, конечно ж е, приемлемо для испы ­
туемых, которым был представлен иллю стративный или типичный случай,
поскольку они достаточно убеждены, что он типичен для значительно боль­
шей группы ; но это оправдание отсутствует для испытуемых “случайной”
группы. И почему испытуемые, которым был представлен контр-иллю ст-
518 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
ративны й или атипичны й случай, вообще долж ны делать какой-либо вы ­
вод по направлению к выборке, а не придерж иваться своих первоначаль­
ны х отнош ений или, возможно, даж е продвинуться в какой-то мере в на­
правлении, противоположном рассматриваемому случаю?
Современная теория о формировании отношения и изменении отношения
предлагает несколько экспериментальных объяснений (Bern, 1967; N isbett &
Ross, 1980; N isbett & W ilson, 1977). Мы можем рассуждать, что испытуемые,
отвечая на вопросы об их отнош ениях, вообще не восстанавливают их из
пам яти. Скорее, они создают их из подручных материалов, включающих их
текущ ую аффективную реакцию на объект, их семантические ассоциации с
объектом и наблюдение их недавнего поведения по отношению к объекту.
Больш ая часть процесса построения быстротечна и недоступна сознанию.
Я ркий единичный случай, вероятно, может вызвать аффективные реакции
по отношению к целому классу объектов, который он представляет, несмот­
ря на компенсирующее, но бледное уверение о типичности. (Аффективные
реакции с большой вероятностью могут “разруш ить когнитивную тюрьму”,
к ак это и было. Н икакое количество уверений об атипичное ти парижского
таксиста, оскорбившего нас, не могут вернуть нас к наш ему предыдущему
ненастороженному отношению к классу париж ских таксистов.) Яркий еди­
ничны й случай может такж е служить побуждением к извлечению сходной
информации из памяти. Х отя гуманные тюремные надзиратели могут напом­
нить испытуемым, совершенно непроизвольно, о добрых нацистских надзи­
рателях в “Героях Х огана” или о милом южном шерифе, изображенном Энди
Гриффитом, в летних повторных показах фильмов их детства. Когда испыту­
емые приступают к созданию своих отношений о тюремных надзирателях
вообще, они могут напомнить себе об игнорировании случайных или контр­
иллю стративных свидетельств, которые они только что видели, и у них это
даж е может успешно получиться, но этого не происходит. Аффективные ре­
акции и содержание пам яти, подвергнутое теперешнему предубеждению,
будут достаточными, чтобы выработать отношение, довольно отличающееся
от отнош ения контрольных испытуемых.
У держ ивая в уме все упомянутые понятия о том, к ак влияет на испы туе­
мы х наблю даемый случай, давайте вернемся к нормативному вопросу: как
следует лю дям регулировать свои выводы в свете знаний о процедуре осу­
щ ествления выборки и типичности выборки с учетом всех ковариантны х
черт? Ф ормальная теория и прикладная статистическая практика предла­
гаю т нам меньш е, чем видит глаз, и значительно меньш е, чем нам нуж но.
Одно правило с неприятны м и реш ительно научным вкусом утверж дает,
что все заклю чения о совокупности следует выводить лиш ь исклю чительно
на основе должным образом случайно осуществленной выборки, иначе пред­
полож ения о статистических процедурах наруш аю тся, и невозможно уз­
нать, какую уверенность следует вклады вать в заклю чение. Согласно этому
суровому правилу, испы туемы е, не получивш ие никакой информации о
процедуре осущ ествления выборки или типичности надзирателя в видеоза­
Улучшение индуктивного вывода 519
писи, долж ны были воздерж иваться от всех выводов, и, таким образом, их
отношение к тюремным надзирателям должно было быть одинаковым, не­
зависимо от того, видели ли они гуманного или жестокого надзирателя.
Это правило может быть отклонено на трех различны х основаниях: гно­
сеологическом, прагматическом и логическом.
1. Первый довод исходит из наблюдения Голдмана, что “...гносеологи­
ческий совет или правила должны быть таким и, чтобы им можно было сле­
довать” (Goldm an, 1978, с. 513). Н аш е обсуждение возможных механизмов
создания отношений наводит на мысль, что “воздержание от выводов” мо­
жет быть возможным правилом для повседневного сознания людей. Возмож­
но, необходимо значительно более подробное правило, показываю щ ее, к ак
освободить от предубеждения содержание ассоциативной пам яти и к ак ком­
пенсировать аффективные реакции.
2. Д аж е если мы можем применить в высш ей степени запрещающ ее пра­
вило, это не окаж ет влияния на препятствование изучению большинства из
того, что мы все-таки изучаем, к ак в повседневной ж изни, так и в науке.
У знавая о деканах колледж а или об условиях движ ения на автомагистра­
лях, человек стойко придерж ивается своей случайной выборки, н а которую
он натолкнулся лично или косвенно. И научные исследования выводов че­
ловека, цитируемые в этой статье, использовали испытуемых, материалы
или обстановку, выборка которы х осущ ествлялась не статистически, но
была в наличии или легко создаваемой.
3. Н аконец, случайность - это не непосредственно наблюдаемое или са­
моочевидное качество процесса осущ ествления выборки; это качество м а­
тематических моделей, которые могут или не могут быть хорошими описа­
ниями процессов реального мира. С лучайная выборка может быть эффек­
тивно “случайной”, потому то мы уверены, что определенные модели явл я­
ются хорошим описанием мира и , к ак мы указы вали, умный статистик,
создающий модели, может облечь подобную интуицию в адекватную мате­
матическую формулировку.
Что мы могли бы посоветовать для родственной проблемы типичности
ковариантны х черт? Поверхностно, это могло бы казаться призывом фор­
мулировать критику против обобщения на основе выборки, которая суще­
ственно отличается от центральной популяции по чертам, являю щ имся воз­
можно релевантны ми. Согласно этому правилу, испытуемые, которые зна­
ли, что вы борка в случае, рассматривавш ем пособия, была атипичной по
одной релевантной черте (продолжительность получения пособия), долж ­
ны были воздерж аться от выводов обо всех других характеристиках этого
случая вообще. Но это правило подвергается такой ж е критике, что и пра­
вило о случайности. Гносеологическая критика точно такая же: верное пра­
вило должно считаться с действительными когнитивными механизмами,
используемыми в извлечении выводов в повседневной ж изни, и должно быть
таким , чтобы ему можно было следовать. П рагматическая критика подоб­
на кри ти ке предыдущего правила. В большинстве научны х исследований
520 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
мож но найти некоторы е черты вы борки, которы е атипичны , и которые
возможно релевантны. Н асколько можно быть убежденным в модели, кото­
рая утверждает, что такие черты являю тся в высокой степени релевантны­
ми? Н аконец, даже если мы знаем или сильно подозреваем, что атипичная
ковариантная черта важ на, мы все ж е можем представить ее значение в мо­
дель и обеспечить соответствующую коррекцию. В примере о доходах музы­
кантов и поэтов-любителей мы могли бы постараться получить сырую оцен­
ку воздействия возраста и пола и сравнить адаптированные средние значе­
ния по двум группам. Конечно ж е, в этом примере было бы почти немыслимо
сделать выводы с какой бы то ни было уверенностью, но это наверняка отто­
го, что у нас нет хорошей модели для воздействия возраста и пола на доход.
Возможно, существуют более м ягкие или менее запрещ ающ ие принци­
пы, которые могут быть использованы? Мы могли бы испробовать, напри­
м ер, принцип: “Знание является экспериментальны м”. Он правилен, но
каж ется слиш ком неопределенным, чтобы ш ироко использоваться. Нам
необходима более подробная статистическая эвристика. Насколько большую
уверенность мы долж ны вклады вать в обобщения, извлеченные из случай­
ны х выборок? К акие экспериментальные выводы можно сделать на основе
атипичны х выборок? Частично эти вопросы обращены к статистикам и фи­
лософам. Существует ли общий подход к построению модели, которая мо­
ж ет быть источником статистической эвристики для индуктивного выво­
да? Но наш е обсуждение механизмов формирования отношений и бессозна­
тельны х процессов, влияю щ их на вывод, должно прояснить, что, к ак Голд­
ман (G oldm an, 1978) доказы вал, гносеологические принципы долж ны про­
ходить проверку способности быть используемыми, равно к ак и валиднос­
ти. И здесь мы сталкиваем ся с еще одним вопросом. Часть процесса вывода,
которы й мы ж елаем модифицировать, является автоматической и бессоз­
нательной (Bern & M cConnell, 1970; G oethals & Reckm an, 1973; N isbett &
W ilson, 1977). К акой ценой можно исклю чить автоматичность? Понимание
инструкций, рассказов, мотивов и т. д ., требование постоянного потока вы­
водов. Разумно подозревать, что автоматичность мож ет быть обнаружена в
этих ф ункциях в приблизительно такой ж е степени, к ак и в восприятии.
Х орош ая статистическая эвристика долж на быть постижимой в отношении
того, где ее можно легко использовать, даж е автоматически.

М огут л и в е р о я тн о с тн ы е м о д ел и и с п о л ь зо в а т ь с я в п о всед н евн о й


ж и зн и ?
Мы рассмотрим программу, в которой вероятностные модели и статисти­
ческая эвристика будут окончательно введены в повседневное размы ш ле­
ние больш инства людей. Мы обсуждали две основные сложности такой про­
граммы: игнорирование того, каки е модели правильны , и отсутствие удоб­
ной статистической эвристики в некоторых важ ны х областях. Третий, в
такой ж е мере слож ны й вопрос, которы й, конечно ж е, логически является
Улучшение индуктивного вывода 521
предш ествующ им, касается способности человека вводить вероятностные
модели и эвристику в повседневное мыш ление. Несмотря на трудности, есть
основания для оптимизма, и некоторые вопросы могут поддаваться экспе­
риментальному исследованию вида, который мы будем описывать позже.
Одним из поводов для оптимизма является то, что размы ш ление челове­
ка изменяется с возникновением новых культурны х изобретений. Подлин­
ные продвиж ения вывода произош ли в пределах последнего исторического
времени. Современному понятию вероятности едва ли больш е 300 лет
(H acking, 1975). И ещ е до 1660 года понятия, которые были в любом смысле
вероятностными, применялись почти исклю чительно к пониманию резуль­
татов, генерированных механизмами случая, таким и к ак игральны е кости
и карты . Однако ф актически каж ды й образованный человек сегодня часто
использует статистическое рассуж дение в некоторы х сферах, например,
спорт и погода, и имеет статистическое понимание механизмов случая, та­
ких к ак кости и карты , которое очень отличается от ранних концепций (Хе-
кинг заходит так далеко, что говорит, что играю щ ий в кости в древние вре­
мена на основе современных концепций вероятности завладел бы всей Гал­
лией в быстром порядке!)
Кроме чисто статистических понятий, довольно много общих индуктив­
ных принципов и руководств появилось относительно недавно. Понятие о
том, что корреляция не является достаточной для установления прич янио-
сти, не появляется до Хьюма (Ншпе) и не получает точного общего у г‘в о ж ­
дения до Учебника политических ошибок Бентама (B entham , 1984/19 >2).
Общий обвинительный акт “критерия сходства” (N isbett & Ross, 1980), к ак
основа для выведения заклю чения о причинно-следственных отнош ениях,
не появляется до Системы логики М илла (M ill, 1843/1974). В самом деле,
до конца 18 столетия совершенно противоположному правилу следовали
врачи, которы х учили рассуж дать в соответствии с “доктриной подписей”.
Согласно этой доктрине, от каж дого естественного лечебного агента можно
ожидать, что он по хорошо заметному внешнему свойству определит болезнь,
против которой он эффективен. Поэтому тяж елы е, подобные гравию объек­
ты, были полезны в лечении желчекаменной болезни, ж елты е объекты были
полезны в борьбе с ж елтухой, и т.д. К счастью, врачи оказались способны­
ми отказаться от этой индуктивной эвристики в пользу других продуктив­
ных эвристик.
Второй повод для оптимизма состоит в том, что хорошее размыш ление
может иногда быть полезнее и легче, чем ошибочное. Мы сказали уж е, что
ош ибки идут от чрезмерного упрощ ения, и что точные модели могут быть
сложными. Но обратное в той ж е мере мож ет быть правдой. Ошибки могут
проистекать от чрезмерно сложного причинного рассуж дения, и отсутствие
хорошей сотого подхода к проблеме может быть причиной того, что люди
генерируют несколько слож ны х плохих подходов. В одном из наш их теку­
щ их экспериментов мы проводим телефонные интервью о спорте, в кото­
рые мы внедрили некоторые вопросы, которые поддаются вероятностным
522 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
ответам. Часто мы получаем краткие, неожиданные (и на наш взгляд, пра­
вильны е) вероятностные ответы. Другие интервью ируемые, которые не ду­
маю т о вероятностном подходе, нереш ительно предлагают несколько длин­
ны х детерминистских объяснений, ни одно из которы х, каж ется, не убеж­
дает даж е самих интервью ируемых, что они на правильном пути.
К ак исторические, так и эпизодические свидетельства отражаю т один и
тот ж е основной смысл. Д аж е быстрые и автоматические процессы вывода
применяю тся в хорошо изученных концепциях и моделях. Рассуж дения
человека и предпочитаемые формы доводов, следовательно, изменяю тся не
только к а к ф ункция созревания индивида, но такж е и к ак ф ункция изме­
нений в язы ке, культуре и образовании.
Недавно мы начали программу исследования, чтобы рассмотреть, как
люди рассуждаю т, и как они учатся рассуж дать, о проблемах, к которым
следует, по наш ему мнению, подходить с вероятностным уклоном. Мы ис­
пользовали проблемы с большим количеством различны х структур и с со­
держ анием , которое имеет тенденцию , в большей или меньш ей степени,
вы зы вать вероятностное мыш ление. Это не место для попыток сообщить
даж е предварительные результаты , но мож ет быть полезным проиллю ст­
рировать материалы , которые мы используем, чтобы указать вопросы, ко­
торые, мы считаем, являю тся достойными для того, чтобы их задали. Что­
бы проиллю стрировать материалы , мы предлагаем следующую проблему.

Выбор колледж а
Дэвид Л. был старшеклассником в школе на Восточном побережье, который планиро­
вал поступить в колледж. Он имел отличные оценки в школе, и у него была возмож­
ность выбора из двух наилучших альтернатив: небольшой колледж свободных искусств
и Ivy League University. Оба заведения имели почти равный престиж и равную оплату
за обучение. Оба находились в привлекательных городах Восточного побережья на при­
близительно равном расстоянии от его родного города. У Дэвида было несколько стар­
ших друзей, посещающих колледж свободных искусств, и несколько друзей, посеща­
ющих Ivy League University. Все они были отличными студентами, как и он, и имели
сходные с ним интересы. Все его друзья из колледжа свободных искусств сообщили,
что им нравится это место, и что они находят его очень стимулирующим. Друзья из Ivy
League University сообщили, что у них много жалоб как на личной и социальной осно­
ве, так и на образовательной основе. Дэвид первоначально думал, что он пойдет в кол­
ледж свободных искусств. Однако он решил сделать однодневные визиты в оба заведе­
ния лично. Ему не понравилось то, что он увидел в частном колледже свободных ис­
кусств: несколько людей, которых он встретил, показались ему холодными и неприят­
ными; профессор, с которым он имел краткую встречу, показался резким и незаинте­
ресованным в нем; и ему не понравилось “ощущение” университетского городка. Ему
понравилось то, что он увидел в Ivy League University: несколько людей, которых он
встретил, показались ему живыми, энтузиастами, приятными в общении; он встретил­
ся с двумя различными профессорами, которые проявили к нему личный интерес; и он
ушел с приятным ощущением университетского городка.
Какое заведение выберет Дэвид Л. и почему? Постарайтесь проанализировать доводы с
обеих сторон и объяснить, какая сторона сильнее.
Улучшение индуктивного вывода 523
Это особенно трудная проблема, потому что она содержит два различны х
вероятностных компонента: (а) довод основного значения, относящ ийся к
маловероятному результату, что Дэвид Л . будет действовать на основе хвос­
та распределения (на основе текущ их реакций своих друзей он может пред­
положить, что модальный ответ по колледж у свободных искусств очень бла­
гоприятен, и что вариативность низка), и (б) довод размера/предубеж дения
выборки, касаю щ ийся адекватности его однодневного разоблачения. Мы
предполагаем, на основе опытного исследования, что каж ды й из этих веро­
ятностных компонентов блокирован обычным набором убеждений. А имен­
но, что профиль предпочтений и антипатий индивида уникален и предска­
зуем только на основе опы та и личности этого индивида. Ощ ущ ения инди­
вида, насколько таинственными они ни были бы в своем происхождении,
являю тся, по крайней мере, надеж ны ми, с небольшим количеством инфор­
мации о том, является ли объект достаточным для создания списка плюсов
и минусов, которы й обеспечивает уверенное руководство для будущих ре­
акций. Больш инство незаконченных ответов по этой проблеме отраж али эти
убеждения (например, “он должен реш ать сам, а не его друзья”). Но не все
ответы таковы . Вот один ответ вы пускника, у которого не было курсовых
работ по вероятности или статистике:
Я бы сказал, что он пойдет в колледж свободных искусств. Его негативный опыт был
лишь кратким, очень поверхностным контактом с заведением. Его друзья, все истинные
клоны его самого, были там (предположительно) некоторое время и знают место близко,
и оно им нравится, тогда как для Университета правдивы обратные утверждения. Одна­
ко он будет оправдан, если будет иметь собственные впечатления об этих местах. Часто
эта интуиция является высшим восприятием, которое мы не можем анализировать, и он
будет прав, следуя ему. Хотя, я думаю, что первый упомянутый мной выбор более наде­
жен, так как его опыт знакомства с двумя заведениями очень ограничен.

Мы считаем этот ответ полностью удовлетворительным статистическим


ответом, хотя, конечно ж е, он не вы сказан на язы ке вероятностных моделей.
Мы начали эти исследования с подозрением, что в большинстве случаев,
где ф ормальная вероятностная модель может быть с пользой применена ста­
тистиком, существуют аналоги в повседневном мире, в которы х подобное
интуитивное использование вероятностного мы ш ления часто происходит у
сообразительных непрофессионалов. Н апример, мы отмечали раньш е, что
люди не могут формулировать модель, в которой поведение индивида рас­
сматривается к ак ф ункция и ситуативных переменных, и диспозиционных
переменны х, и в которой некоторые ситуации вызываю т высокую вероят­
ность поведения у больш инства индивидов. Все ж е мы думаем, что люди
всетаки оперируют чем-то похожим на этот вид моделей, когда поведение -
это хорошее выполнение теста. Концепция “легкого теста”, когда большин­
ство людей имеет высокую вероятность хорошего вы полнения, ш ироко и з­
вестна и используема в наш ей культуре. Мы подозревали, что другие виды
вероятностных моделей, для других видов проблем, будут такж е применять­
ся в повседневных выводах. Н аш и исследования пы тались продемонстри­
524 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ
ровать этот вопрос, показы вая, что люди могут хорошо справляться с опре­
деленными проблемами, в то время к ак терпят неудачу в других с подобной
формальной структурой, потому что в их моделях, леж ащ их в основе после­
дних проблем, отсутствует вероятностный компонент.
Если подозрение подтверждается, это приводит нас к ряду вопросов, на
которые мы можем постараться ответить экспериментально. В какой степе­
ни хорошее вероятностное размыш ление обязано применению абстрактной
или формальной модели определенного типа? Почему формальная модель
долж на быть легко применимой в конкретны х задачах определенного типа и
редко в других? Если успешное размыш ление не является применением бес­
содержательной формальной модели, тогда к ак оно должно быть описано в
теоретических терминах? Другие вопросы касаю тся индивидуальных разли­
чий в моделировании и использовании правил. В какой степени использова­
ние вероятностного рассуждения является устойчивой личной диспозицией?
Коррелирует с интеллектом? Связана с полученным образованием?
Н аконец, имеется набор важ ны х вопросов, касаю щ ихся проблем возмож­
ности обучения созданию вероятностны х моделей. Основной вопрос уж е
получил ответ в наш ем исследовании: Людей можно обучить к ак курсами
традиционной статистики, так и более быстрыми методами, чтобы отвечать,
по крайней мере, по многим “словесным проблемам”, типа тех, что были
упомянуты нами, более вероятностным образом. В какой степени поддер­
ж иваю тся действительные суж дения повседневной ж изни, обучающие тех­
ники которы х наиболее эффективны, и каковы наилучш ие индуктивные
принципы и методы обучения - вот важ ны е вопросы, которые мы только
начали задавать. Мы надеемся, что получим помощь.
У л у ч ш ен и е и н д у к ти в н о го вы вода 525
Часть IX
Восприятие риска
33. Факты против страха: понимание воспринимае­
мого риска *

Пауль Словик, Барух Фишхофф


и Сара Лихтенштейн

Люди реагируют на риск, который они воспринимают. Если их восприятие


ошибочно, попытки личной, общественной и средовой защиты, вероятно, бу­
дут неправильно направлены. Д ля некоторых видов риска, например, дорож­
но-транспортных проишествий, имеются в наличии экстенсивные статисти­
ческие данные, для других подобных деятельностей, таких как потребление
алкоголя и табака, оценка риска требует сложных эпидемиологических и экс­
периментальных исследований. Однако, даже если статистические данные в
избытке, только “неопровержимые” факты могут вести так далеко, чтобы раз­
рабатывать способ действий. В каком-то смысле, суждение человека необходи­
мо для интерпретации результатов и определения их релевантности.
Однако, другие виды риска, такие к ак исследование модифицированно­
го ДНК или атомная энергия, так новы, что оценка риска, скорее, должна
быть основана на сложном теоретическом анализе, таком как дерево оши­
бок (см. рис.1), чем на непосредственном опыте. Несмотря на появление
объективности, этот анализ такж е вклю чает большой компонент суждения.
П олагаясь на тренированную интуицию , необходимо определить структу­
ру проблемы, последствия, с которыми надо считаться и важность различ­
ных ветвей дерева ошибок. К ак только анализ будет представлен, с ним дол­
ж ны взаимодействовать те, кто в действительности имеет дело с риском,
вклю чая промыш ленников, специалистов по окружаю щ ей среде, регули­
ровщ иков, законодателей и избирателей. Если эти люди не понимают или
не верят данным, которые им демонстрируют, то тогда возможны недове­
рие, конф ликт и неэффективное управление риском.

*Это пересмотренная версия статьи, которая первоначально появилась в книге под редак­
цией R. Schwing и W. А. Albers Jr. Оценка риска общества: Насколько безопасность дос­
таточно безопасна? New York: Plenum Press, 1980. Авторские права © 1980 имеет Plenum
Press. Печатается в соответствии с разрешением. Поддержка этой работы была обеспечена
Программой оценки технологий и анализа риска фонда Национальной науки по Гранту
PRA79-11934 Университету Кларка согласно субдоговору с Perceptronics, Inc.
530 ВОСПРИЯТИЕ РИСКА
Эта глава исследует некоторые психологические элементы процесса оцен­
ки риска. Ее основные предпосылки в том, что к ак общество, так и экспер­
ты являю тся необходимыми участниками этого процесса, что оценка внут­
ренне субъективна, и что понимание ограничений суж дения является ре­
ш аю щ им в процессе принятия реш ений.

Рис. 1. Дерево ош ибок, показываю щ ее различны е способы, кото­


рыми радиоактивные материалы могут быть случайно выброшены
из ядерны х отходов, захороненных в солевых залеж ах. Каждое из
возмож ны х инициирую щ их событий в двух ниж них рядах может
приводить к переносу радиации подземными водами. Этот перенос,
в свою очередь, может способствовать выбросу радиации в биосфе­
ру. К ак показано вторым уровнем, выброс радиации мож ет быть
такж е произведен непосредственно (без помощи подземных вод) при
падении огромного метеорита, использовании ядерного оруж ия или
вулканическом изверж ении (McGrath , 1974)

П р е д у б е ж д е н и я в с у ж д ен и ях п р и в о с п р и я ти и р и с к а
Когда непрофессионалов просят оценить виды риска, у них редко имеются
под рукой статистические данные. В большинстве случаев они должны де­
лать выводы, основываясь на том, что они помнят из услыш анного и наблю­
давш егося о рассматриваемом виде риска. Психологическое исследование,
больш ая часть которого была описана в этой книге ранее, идентифицирова­
Факты против страха... 531

ло ряд общих правил вывода, которые люди, по-видимому, используют в


подобных ситуациях. Эти правила суж дения, известные к ак эвристики, ис­
пользуются для упрощ ения слож ны х умственных задач до простых. Я вля­
ясь валидными при одних обстоятельствах, при других они приводят к силь­
ным и устойчивым предубеждениям которые серьезно вовлечены в приня­
тие реш ений в таких различны х областях, к ак финансовый анализ (Slovic,
1972) и управление природным риском (Slovic, K unreuther & W hite, 1974).

Дост упност ь
Одна из эвристик, которая имеет особую релевантность для восприятия рис­
ка, назы вается доступность (Tversky & K ahnem an, 1973,11). Люди, исполь­
зующие эту эвристику, судят о событии к ак о вероятном или частом, если
его примеры можно легко представить или вспомнить. Так к ак часто проис­
ходящ ие события обычно легче представить или вспомнить, чем редко про­
исходящ ие события, доступность часто является подходящ им признаком.
Однако на доступность оказы ваю т влияние многочисленные факторы , не
связанные с частотой происхождения события. Например, недавнее бедствие
или ярки й фильм, такой к ак “ Челюсти” или “Китайский синдром”, могли
бы серьезно исказить суждения о риске.
Предубеждение доступности помогает объяснить неправильное воспри­
ятие людей и ошибочные реш ения в отношении определенных естествен­
ных видов риска. Н апример, обсуждая ж ителей затопляемы х территорий,
Кейтс (K ates, 1962) писал:
Главное ограничение способности людей использовать улучшенную информацию о рис­
ке наводнения - это то, что в основном они полагаются на опыт. Люди в затопляемых
территориях оказываются в большой степени пленниками своего опыта... Недавние
наводнения, кажется, устанавливают стремящиеся вверх границы размеров потерь, о
которых, по убеждениям менеджеров, люди могли бы побеспокоиться заранее, (с. 140)

Кейтс приписывает сложность улучш ения контроля наводнения, в основ­


ном, “неспособности индивидов концептуализировать наводнения, которые
никогда не происходили” (K ates, 1962, с. 92). Он наблюдал, что индивиды,
прогнозирующие потенциал наводнения, “находятся под сильным влияни­
ем своего недавнего прошлого и ограничиваю т свою экстраполяцию к упро­
щенным конструкциям, рассматривая будущее как отражение своего про­
шлого” (с. 88). Подобным образом, заклю чение страховых договоров от зем­
летрясения резко увеличивается после землетрясения, а затем постоянно сни­
ж ается с угасанием воспоминаний (Steiribrugge, McClure & Snow, 1969).
Особенно важ ны й результат эвристики доступности состоит в том, что
обсуждение низковероятного риска мож ет увеличить его запоминаемость и
способность его представить и, таким образом, его каж ущ ую ся рискован­
ность, независимо от того, что показы ваю т свидетельства. Например, лиде­
ры в области исследований модифицированного ДНК быстро раскаялись в
532 ВОСПРИЯТИЕ РИСКА
представлении общественному вниманию слабого риска “загрязнения” но­
выми организмами. Розенберг (R osenberg, 1978) подытожил реакцию , ко­
торая последовала обнаружению предположительного риска:
П ервоначально ответом бы ла похвала... социальной ответственности,
проявленной вовлеченными в это дело учены ми.... Однако, постепенно и
предсказуемо дебаты стали накаленны ми. Размы ш ления были в изобилии,
и чем страш нее был сценарий, тем ш ире была огласка, которую он получал.
Многие из дискуссий по этому вопросу полностью потеряли из вида тот факт,
что опасность была, прежде всего, гипотетической, и предположили, что
лаборатории, где проводились исследования по модификации ДНК, были
полны беш еных животны х. В конечном счете, сами ученые, чья сдерж ан­
ность привела в движение весь процесс, были очернены, (с. 29)
Мнение о частоте смертельных событий. Предубеждение доступности
проиллю стрировано несколькими исследованиями, в которы х студенты
колледж а и члены Лиги женщ ин-и .бирателей судили о частоте 41 причи­
ны смерти (L ichtenstein и другие, 19 78). В одном исследовании этим людям
сначала сообщили о годовой смертности по одной причине (автомобильные
аварии) в СШ А (50. 000), а затем попросили оценить частоту остальных 40
причин. В другом исследовании участников попросили вынести суждение,
к а к а я из двух причин смерти в паре была более частой. В обоих исследова­
н и ях суж дения были умеренно точны в глобальном смысле: люди обычно
знали, каки е события были наиболее и наименее часты ми. Однако внутри
этой глобальной картины люди соверш али серьезные ош ибки в суж дениях,
многие из которы х оказы вались отражением предубеждения доступности.
Рисунок 2 сравнивает количество смертей в год согласно суж дениям ис­
пытуемых с количеством смертей по данным статистики общественного здо­
ровья. Если суж дения о частоте были точными, они будут равны статисти­
ческим нормам, всеми точками находясь на линии идентификации. Х отя
более вероятные виды риска обычно вызываю т более высокие оценки, точ­
ки оказы ваю тся разбросанными по кривой линии, которая пролегает иног­
да вы ш е, а иногда ниж е линии точных суждений. В целом, редкие причины
смерти были переоценены, а распространенные причины смерти были не­
дооценены.
Кроме этого общего предубеж дения, было очевидным специфическое
предубеждение по размерам. Н апример, было вынесено суждение, что не­
счастны е случаи являю тся причиной такого ж е количества смертей, что и
болезни, тогда к ак болезни в действительности уносят в 16 раз больше ж и з­
ней. Убийства неправильно рассматривались к ак более часты е, чем смерти
от диабета и рака ж елудка. Они такж е рассматривались такими ж е часты ­
м и, к ак и смерти от удара, хотя последние в действительности уносят в 11
раз больше ж изней. Частота смертей от ботулизма, торнадо и беременности
(вклю чая роды и аборты) была такж е значительно переоценена. В таблице 1
перечислены смертельные события, суж дения о частоте которы х в различ­
Факты против страха... 533
ных наш их исследованиях были наиболее неправильными. В продолжение
рассмотрения доступности, переоцененные причины смерти были драма­
тическими и сенсационными, тогда к ак недооцененные причины скорее
были незрелищ ными событиями, которые вызываю т одну ж ертву и явля­
ются привычными в своей несмертельной форме.

Рис. 2. Отношения между оцененной частотой и действительным ко­


личеством смертей в год по 41 причине. Если оцененные частоты и
действительные частоты были равны , данные попали бы напрям ую
линию . Точки и кривая, им соответствующ ая, представляю т сред­
ние ответы огромного количества непрофессионалов. К ак индекс
изменчивости среди различны х индивидов, прочерчены вертикаль­
ные полоски, изображаю щ ие 25-й и 75-й процентили суждений о
ботулизме, диабете и всех несчастных случаях. Область распреде­
ления ответов по другим 37 причинам бы ла сходна
534 ВОСПРИЯТИЕ РИСКА

Таблица 1. Предубеждение о частоте смертей в суждениях

Н аиболее переоцененные _____ Н аиболее недооцененные


Все несчастные случаи Прививка от оспы
Автомобильные аварии Диабет
Беременность, роды, аборты Рак желудка
Торнадо Молния
Наводнение Инсульт
Ботулизм Туберкулез
Все виды рака Астма
Пожары и возгорания Эмфизема
Ядовитый укус животного
или насекомого
Убийства

Источник: Slovic, Fischoff & L ichtenstein, 1976.

Подверженные предубеждению газетные репортажи и подверженные


предубеждению суждения. Эвристика доступности вы двигает на первый
план ж изненно важ ную роль опыта к ак детерминанты воспринимаемого
риска. Если опыт человека подвержен предубеждению, то его восприятие,
вероятно, будет неточным. К сожалению , большинство информации, под
воздействием которой находятся люди, обеспечивает искаженную картину
м ира рисков. Рассмотрим наблюдение автором Ричардом Бахом страха,
вы сказанного супруж еской парой, впервые летящ ей на самолете:
П ри всем этом ветре и гудении двигателя, и земле, кренящ ейся и стано­
вящ ейся все меньш е под нам и, я наблюдал за моими парнем и его девуш кой
из Висконсина и видел, к ак они меняю тся. Н есмотря на их смех, они боя­
лись самолета. Все, что они знали о полетах, было почерпнуто из газетны х
заголовков, сообщ ения о столкновениях, авариях и смертельных случаях.
Они не читали ни единого сообщения о том, к ак маленький самолет взле­
тел, пролетел по воздуху и благополучно приземлился. Они могли только
верить, что это возможно, несмотря на газетны е статьи, и на эту веру они
поставили три доллара и свои ж изни (Bach, 1973, с. 37).
К ак продолж ение исследований, о которы х сообщалось вы ш е, Кобс и
Словик (Combs и Slovic, 1979) рассмотрели сообщения о причинах смерти в
двух газетах на противоположных побережьях США. Записывались различ­
ные индексы газетны х репортаж ей по чередующ имся месяцам в течение
одного года. Результаты вы явили, что обе газеты имеют сходное предубеж­
дение в своих репортаж ах о событиях, угрожаю щ их ж изни. Например, рас­
смотрение Таблице 2 обнаруживает, что о многих из статистически частых
причин смерти (например, диабет, эмфизема, различны е формы рака) ред­
ко сообщалось в обеих газетах в течение периода исследования. Кроме того,
о ж естокихх, часто катастроф ических событиях, таких к ак торнадо, пож а­
Факты против страха... 535
ры, случаи утопания, убийства, автомобильные аварии и все несчастные слу­
чаи, сообщалось чащ е, чем о менее драматических причинах смерти, имею­
щ их подобную (или даж е большую) статистическую частоту. Например, бо­
лезни уносят в 16 раз больше ж изней, чем несчастные случаи, но в газетах
было в 3 раза больше статей о несчастных случаях, отмечавш их в 7 раз боль­
шее количество смертей. Среди наиболее часты х событий, убийства были
категорией, о которой сообщалось больше всего в пропорции к действитель­
ной частоте. Х отя болезни уносят в 100 раз больше ж изней, чем убийства, в
газетах было в 3 раза больше статей об убийствах, чем о смертях от болез­
ней. Более того, статьи об убийствах имели тенденцию быть в 2 раза длин­
нее статей, сообщающих о смертях от болезней и в результате несчастных
случаев.
Более того, предубеждения в газетны х репортаж ах и суж дениях людей
были достаточно сходными. К орреляция между оцененной частотой смер­
ти и количеством смертей, сообщаемым в газетах, была около 0.70. Эта вы ­
сокая корреляция была не за счет общей ассоциации к ак тех, так и других
смертей со статистической частотой. Когда последняя удерживалась посто­
янной, частичны е корреляции между суж дениями людей и количеством
сообщаемых смертей были 0.89 и 0.85 для этих двух газет. Х отя на основе
этих двух корреляций заманчиво сделать заклю чение, что репортажи в сред­
ствах массовой информации оказы ваю т влияние на восприятие риска, дело
может быть такж е в том, что мнения людей относительно того, что важ но,
влияю т на СМИ. Ж урналистская литература насыщ ена примерами, в кото­
рых влияние происходит в каж дом из направлений (B rücker, 1973).

Таблица 2. Статистическая частота и газетные репортажи в “Register


Guard” (Eugene, Oregon) и”Standard Times” (New Bedford, Massachusetts)
no 41 причине смерти.

Н орм а по Сообщае­
Оценки мые Случаи, Статьи
2,05*10*
Причина смерт и испы т у­ смерт и
респонден­
ем ы х
тов США R-G S-T R-G S-T R-G S-T
Оспа 0 57 0 0 0 0 0 0
Отравление витаминами 1 102 0 0 0 0 0 0
Ботулизм 2 183 0 0 0 0 0 0
Корь 5 168 0 0 0 0 0 0
Фейерверк 6 160 0 0 0 0 0 0
Прививка от оспы 8 23 0 0 0 0 0 0
Коклюш 15 93 0 0 0 0 0 0
Полиомиелит 17 97 0 0 0 0 0 0
Ядовитый укус
животного или 48 350 0 0 0 0 0 0
насекомого
536 ВОСПРИЯТИЕ РИСКА
Продолжение табл. 2

Торнадо 90 564 36 25 10 6 14 7
Молния 107 91 1 0 1 0 1 0
Неядовитое животное 129 174 4 2 4 2 4 2
Наводнение 205 736 4 10 2 2 2 2
Чрезмерное
334 314 0 0 0 0 0 0
переохлаждение
Сифилис 410 492 0 0 0 0 0 0
Беременность, роды,
аборт 451 1,344 0 0 0 0 0 0
Инфекционный гепатит 677 545 0 0 0 0 0 0
Аппендицит 902 605 0 0 0 0 0 0
Удар электрическим 5 0 5 0 6
током 1.025 766 0
Столкновение 0 1 0 1 0
1.517 689 1
поездов/автомобилей
Астма 1.886 506 1 0 1 0 1 0
Несчастный случай с 1.345 8 1 8 1 9 1
огнестрельным оружием 2.255
Отравление
твердым/жидким 2.563 1.013 3 3 1 1 1 1
веществом
Туберкулез 3.690 658 0 0 0 0 0 0
Пожары и возгорания 7.380 3.336 94 46 33 9 38 10
Случаи гибели на воде 7.380 1.648 47 60 44 24 45 37
Лейкемия 14.555 2.496 1 0 1 0 1 0
Случайное падение 17.425 2.675 15 7 15 6 16 9
Убийство 18.860 5.582 278 208 167 122 329 199
Эмфизема 21.730 2.848 1 0 1 0 1 0
Суицид 24.600 4.679 29 19 28 18 36 20
Рак груди 31.160 2.964 0 0 0 0 0 0
Диабет 38.950 1.476 0 1 0 1 0 1
Автомобильная авария 55.350 41.161 298 83 245 69 180 73
Рак легких 75.850 9.764 3 2 3 2 4 2
Рак желудка 95.120 3.283 0 1 0 1 0 1
Все несчастные случаи 112.750 88.879 715 596 421 152 374 177
Инсульт 209.100 7.109 12 4 12 4 13 4
Все формы рака 328.000 45.609 25 12 25 12 26 15
Болезнь сердца 738.000 23.599 49 30 45 25 46 25
Факты против страха... 537

Продолжение табл. 2
Все болезни 1.740.450 88.838 111 87 100 76 104 78
Общее количество
репортажей (причины
10, 11, 13, 29, 31, 37 1.174 945 729 376 860 483
и 41)
БЬрреляции (R-G
против S-T)_________ г = 0.97 г = 0.94 г = 0.98

Примечание: R-G = “Register Guard”; S-T = “Standard Times”


Источник: Combs & Slovic (1979).

Со мной это не случится. Суждения людей о причинах смерти, возможно,


так хорош и, к ак того можно ож идать, учиты вая, что они не являю тся ни
специалистами в рассматриваемых видах риска, ни обеспечены репрезен­
тативными выборками информации. Точное восприятие вводящ их в заб­
луждение выборок информации мож ет такж е рассматриваться, к ак леж а­
щее в основе другого очевидного предубеждения суждений - склонности
людей рассматривать самих себя как обладающ их личным иммунитетом от
риска. Подавляющее большинство людей уверены, что они лучш е, чем сред­
ние водители (N aatanen & Sum m ala, 1975; Svenson, 1980), более вероятно,
чем это есть в среднем, прож ивут более 80 лет (W einstein, 1980), менее веро­
ятно, чем это есть в среднем, понесут ущерб от потребляемых продуктов
(R ethans, 1979) и так далее. Х отя такое восприятие является, очевидно, не­
реалистичны м, в перспективе опы та отдельного индивида риск вы глядит
очень маленьким. Рассмотрим вождение автомобиля: несмотря на быстрое
вождение, подрезание и т.д ., плохие водители совершают поездку за поезд­
кой без неудач. Этот личны й опыт демонстрирует им их исключительное
мастерство и безопасность. Более того, их косвенный опыт через средства
массовой информации показы вает им, что если происходят несчастные слу­
чаи, они происходят с другими. П олучая подобный вводящ ий в заблужде­
ние опыт, люди чувствуют себя достаточно оправданными, отказываясь при­
нимать защ итны е меры, такие к ак использования ремня безопасности в ав­
томобиле (Slovic, Fischoff & L ichtenstein, 1978).
Вне тюля зрения - вне размышлений. В некоторых ситуациях неспособность
оценить пределы “имею щ ихся в наличии” данны х, может успокаивать са­
модовольство людей. В исследовании Ф иш хоффа, Словика и Лихтенш тейн
(Fischoff, Slovic и L ichtenstein, 1978) три группы студентов колледж а по­
просили оценить полноту дерева ош ибок, показы ваю щ его риск, связан­
ный с проблемой завести маш ину (см. рис. 3). Одна группа видела полное
дерево. К аж дая из двух других групп получила другое, сокращ енное дере­
во. В одном варианте отсутствовали ветви пуска, заж игания и злонамерен­
538 ВОСПРИЯТИЕ РИСКА
ны х действий; другому варианту недоставало ветвей, подробно описываю­
щ их аккум улятор, топливо и другие проблемы двигателя.
И нструкция к задаче гласила следующее (цифры в скобках были пред­
лож ены лю дям, которые видели сокращ енное дерево):
Каждый день по всем Соединенным Штатам миллионы водителей выполняют следую­
щие действия: садятся в машину, вставляют ключ в замок зажигания, пытаются заве­
сти двигатель. Иногда двигатель не заводится, и поездка откладывается. Мы бы хоте­
ли, чтобы вы подумали о разнообразных проблемах, которые могут быть достаточно
серьезными, чтобы быть причиной того, что машина не может завестись и поездка во­
дителя откладывается, как минимум, на 1 минуту.
Диаграмма на следующей странице предназначена для того, чтобы помочь вам поду­
мать об этих проблемах. Она показывает шесть (три) главных недостатков, являющих­
ся причиной того, что двигатель машины не заводится. Эти главные категории, воз­
можно, не ох ватывают всех возможностей, поэтому мы включили седьмую (четвертую)
категорию: все другие проблемы.
Пожалуйста, тщательно рассмотрите эту диаграмму и ответьте на следующие вопросы:
Оцените, в среднем, какое количество из 100 задержек, когда поездка откладывается
из-за “неудачи запуска”, вызвано каждым из семи (четырех) факторов. Поставьте свои
оценки в строках бланка согласно факторам, названным ниже.

Если лю ди, которы е видели сокращ енные деревья, были долж ны м обра­
зом чувствительны к тому, что упущено, доля проблем, которые они отнес­
ли к “другим проблемам”, уравняет сумму долей проблем, отнесенных к со­
кращ енны м ветвям и к “другим проблемам” теми, кто видел полное дерево.
Результаты в Таблице 3 показываю т: что было вне поля зрения, было вне
рассуж дений. Н апример, в сокращ енном дереве группы 1 “другие пробле­
м ы ” долж ны были увеличиться в ш есть раз (от 0.078 до 0.468), чтобы отра­
зить долю наруш ений из-за проблем запуска, заж игания и злонамеренных
действий, которы е были упущ ены в диаграмме. Вместо этого, “другие про­
блемы” были только удвоены, тогда к ак значение трех упомянуты х систем
было сущ ественно увеличено. Второе исследование не только повторило эти
результаты , но и показало, что люди, рассматривавш ие сокращ енные дере­
вья, судили о неудаче пуска (по всем причинам), к ак менее вероятной, чем
это делали те, кто наблю дал несокращ енное дерево.
Факты против страха... 539


§

2
К
ф

тН <м со 1-нсм ео^ нсзсо ^ ю ф ь -ХО^


О тН см со
н и н н

аи cd
ft
0
g н
IS 1
1 1
К § s£
IS
® й «S
*5 § К со Я
540 ВОСПРИЯТИЕ РИСКА

«
ев
Факты против страха... 541
542 ВОСПРИЯТИЕ РИСКА
1 s и S
I ьЯ S
д 1Л gi
*

| 1 1 |
g, s s I
2 » й ‘

§4 §
s 5 -

§ I 6"
я Л £
§ В. « 8 * g
&I i * g I
I « Я 8 11
“ «§ * I g l
8 ä % ° -I
I B l H «
III Iff
i J a PQ H 5
&g I g “
|5 g 8 g l
i i a111
SUMS
« a
S3 9 1
S x§
в о
W W w ^ S3

о“• § 1
—1^ 1
*Р 3 S S- H-
ОРч s §5
i-i ei ео ° r
ф 2
£
а п

8.3 х 3
g з
м
3
О
59 1 IВ
Факты против страха... 543

Таблица 3. Приписывание нарушений запуска для сокращенного и несок­


ращенного деревьев

Средняя доля нарушений запуска по типу


Акку­ Пуско­ Топлив­ Систе- Двига- Злона- Дру-
муля­ вая ная ма тель мерен- гие
тор систе­ система зажи­ ные
ма гания дейст­
Группа п вия
Несокращенное 0.264 0.195
дерево 93 0.193 0.144 0.076 0.051 0.078
Сокращенное -
дерево 1 29 0.432 0.309 0.116 0.140“
Сокращенное 26 - -
0.357 0.343 0.073 0.227ь
дерево 2

Примечание: Тире означает, что данная ветвь была убрана


“Должно быть 0.468
ьДолжно быть 0.611
Источник: Slovic, Fischoff & L ichtenstein (1978)
Чрезмерная уверенность
Знание с уверенностью. Особенно вредный аспект эвристики состоит в том,
что люди типично имеют большую уверенность в суж дениях, основанных
на ней. В другом исследовании, развиваю щ ем идею изучения причин смер­
ти, людей попросили указать ш ансы того, что они были правы , выбирая бо­
лее частое из пары смертельных событий (Fischoff, Slovic & L ichtenstein,
1977). Таблица 4 показы вает процентное отношение правильны х ответов
по каж дой из наиболее часто используемых категорий ш анса. В экспери­
менте 1 испытуемые были разумно калиброваны , давая ш ансы 1:1, 1.5:1,
2:1 и 3:1. То есть, процентное соотношение их правильны х ответов по этим
шансам было близким к соответствующему правильному процентному со­
отношению. Однако тогда как ш ансы возрастали с 3:1 до 100:1, точность
увеличивалась незначительно или вовсе не увеличивалась. Только 73% от­
ветов с ш ансами 100:1 были правильны ми (вместо 99,1% ). Точность под­
скочила до 81% при ш ансе 1.000:1 и до 87% при 10. 000:1. Д ля ответов с
ш ансами 1. 000. 000:1 или больш ими, точность составляла 90% ; соответ­
ствующая степень уверенности была у шансов 9:1. 12% ответов, не пере­
численных в табл. 3, так к ак они попали в промежуток между наиболее упот­
ребляемыми категориями ш анса, показали сходную модель чрезмерной уве­
ренности. Резю мируя, можно отметить, что испытуемые были часто не пра­
вы, даж е н а самых вы соких уровнях ш ансов. Более того, они дали много
предельных ответов по шансам. Больш е половины их суждений имели шанс,
больший, чем 50:1. Почти четверть - больш ий, чем 100:1.
544 ВОСПРИЯТИЕ РИСКА
Второй эксперимент пы тался улучш ить результаты, предлагая испыту­
емым больше инструкций. Экспериментальная сессия началась с 20-минут­
ной лекции, которая подробно объясняла концепцию вероятности и шанса.
Обсуждались тонкости вы раж ения чувства неуверенности человека сужде­
ниям и о численны х ш ансах, с особым ударением на том, как использовать
маленькие ш ансы (между 1:1 и 2:1), если довольно неуверен в правильном
ответе. Б ы ла дана диаграмма, показы ваю щ ая отнош ения между разнооб­
разны ми ш ансами и соответствующей вероятностью. И, наконец, испытуе­
мы х обучили концепции калибровки (Глава 22) и настоятельно попросили
вынести ш ансовые суж дения таким образом, чтобы они были хорошо ка­
либрованы. Х отя результаты немного улучш ились, испытуемые снова де­
монстрировали неоправданную уверенность (см. табл.4). Они приписали
ш ансы , больш ие или равные 50:1, приблизительно 1/3 вопросов. Только
83% ответов, связанны х с этими ш ансами, были правильными.

Таблица 4. Процентное отношение правильных ответов для основных


категорий шансов

Вопросы на
Летальные события общие темы
Соотвую- Эксперимент 1ь Эксперимент 2Ь Эксперимент Зь
щий
Шансы Пра­ Пра­ Пра­
правиль­
ный %а % виль­ % виль­ % виль­
N N N N ный
N ный N ный
% % %
1:1 50 644 9 53 339 8 54 861 19 53
1,5:1 60 68 1 57 108 2,5 59 210 5 56
2:1 67 575 8 64 434 10 65 455 1 63
3:1 75 189 2 71 252 6 65 157 3,5 76
5:1 83 250 4 70 322 8 71 194 4 76
10:1 91 1 167 17 66 390 9 76 376 8 74
20:1 95 126 2 72 163 4 81 66 1,6 85
50:1 98 258 4 68 227 5 74 69 1,5 83
100:1 99 1 180 17 73 319 8 87 376 8 80
1.000:1 99,9 862 13 81 219 5 84 334 7 88
10.000:1 100 459 7 87 138 3 92 263 6 89
100.000:1 100 163 2 85 23 0,5 96 134 3 92
1.000.000:1 100 157 2 90 47 1 96 360 8 94
Итого 6.098 88 2.981 70 3.855 75
Общий правильный 71.0 72.5 73.1
%
Факты против страха... 545
Примечание: % N относится к процентному отношению суждений о ш ан­
сах, которые попали в каждую основную категорию. В эксперименте 1 было
66 испытуемых, в Эксперименте 2 - 40 и в Эксперименте 3 - 4 2 .
аДля хорошо калиброванных испытуемых
ьЭксперименты 1, 2 и 3 были обозначены Эксперименты 2, 3 и 4 в первона­
чальном отчете.
Источник : Fischoff, Slovic & Lichtenstein (1977)

В третьем эксперименте люди оказались такими ж е самоуверенными, отве­


чая на вопросы по общим темам (например, какой журнал имел наиболь­
ший тираж в 1970 году? (a) Playboy или (б) Time), к ак и в ответах на вопросы
о частоте летальных событий (см. табл. 4). Дополнительное исследование
Фишхоффа и других проверило веру людей в свои шансовые оценки, спра­
шивая, поставили бы они на них деньги, держа пари, описанное ниже:

И нст р укц ия к игре по реш ению “пуст яковы х задачек”

Эксперимент закончился. Вы только что заработали $2.50, которые Вы вскоре можете


взять. Но перед тем как взять деньги и уйти, я бы хотел, чтобы Вы подумали, не захоти­
те ли Вы сыграть в определенную игру, чтобы возможно увеличить Ваш заработок. Пра­
вила игры таковы:

1. Посмотрите на Ваш ответный лист. Найдите вопросы, по которым Вы оценили


Ваши шансы правильными как 50:1 или больше, чем 50:1. Сколько было таких вопро­
сов? (напишите количество).

2. Я дам правильные ответы на эти вопросы “50:1 или больше”. Мы посчитаем,


сколько раз ваши ответы на эти вопросы были неправильны. Поскольку неправильный
ответ при такой высокой уверенности будет удивительным, мы назовем эти неправиль­
ные ответы “вашими удивлениями”.

3. Передо мною мешочек с фишками для покера. В нем 100 белых фишек и 2 крас­
ных. Если я наугад выберу фишку, шанс, что я выберу белую фишку, равен 100:2 или
50:1, как и шанс, что ваши “50:1 или больше” ответы правильны.

4. За каждый ответ “50:1 или больше”, данный вами, я буду вытягивать из мешоч­
ка фишку. (Если хотите, вы можете сами вытягивать для меня фишки.) Я буду класть
фишки в мешочек, перед тем как снова вытягивать, таким образом, шансы не изменят­
ся. Вероятность того, что я вытяну красную фишку, равна 1/51. Поскольку вытягива­
ние красных фишек маловероятно, каждая красная фишка, вытянутая мною, будет
рассматриваться как “мое удивление”.

5. Каждый раз когда Вы удивлены неправильным ответом на вопрос “50:1 или боль­
ше”, Вы платите мне $1 (увеличивая до 2.50 в некоторых условиях). Каждый раз, ког­
да я удивлен, вытянув красную фишку, я плачу вам $ 1.
546 ВОСПРИЯТИЕ РИСКА
6. Если вы хорошо калиброваны, эта игра для Вас выгодна. Это потому, что я ожидаю
потерять $1 один раз из 51 попытки вытягивания фишки, в среднем. Но поскольку
ваши шансы иногда выше, чем 50:1, вы ожидаете иметь потери даже реже, чем я.

7. Будете ли вы играть в эту игру?

Это пари выгодно для отлично калиброванных и недостаточно уверен­


ных участников и невыгодно для самоуверенных. Большинство участни­
ков нашего исследования с нетерпением хотело сыграть в эту игру. Посколь­
ку их уверенность была неоправданна, они терпели ощутимые денежные
потери (которые мы вернули им после окончания исследования).
Х отя психологическая основа неоправданной уверенности сложна, клю ­
чевым элементом оказывается недостаточное осознание людьми того, что
их знания основаны на предположениях, которые часто являю тся незначи­
тельными. Например, 30% респондентов в Эксперименте 1 дали шансы,
большие, чем 50:1, неправильному утверждению о том, что убийства более
часты, чем самоубийства. Этих испытуемых ввело в заблуждение то, что
примеры убийства гораздо легче припомнить, и они оказались неспособны­
ми оценить, что запоминаемость - это несовершенная основа для подобных
выводов.
Гиперточность. Чрезмерная уверенность такж е может проявляться и
другими способами. Типичная задача по оценке неопределенных количеств,
таких к ак нормы неудач, состоит в установке верхних и ниж них границ
таким образом, что существует шанс 98% , что правильное значение лежит
между ними. Эксперименты с разнообразными группами людей, вынося­
щ ими различные виды суждений, показали, что скорее не 2% правильных
значений выпадают из 98% границ уверенности, а 20 - 50% (глава 21 и 22).
Таким образом, люди думают, что они могут оценить такие значения с го­
раздо большей точностью, чем это происходит на самом деле. Тверски и Ка-
неман (Tversky и Kahneman, 1974,1) отнесли такую гиперточность за счет
опоры на эвристику привязки и регулирования.

Чрезмерно уверенные эксперты. К сожалению, эксперты, вынужденные


вы йти за пределы данных и опираться на суждения, могут быть так ж е
склонны к чрезмерной уверенности, к а к и обыватели. Фишхофф, Словик и
Лихтенш тейн (Fischhoff, Slovic и Lichtenstein, 1978) повторили свое иссле­
дование по дереву ошибок (рис. 3) с профессиональными автомеханиками
(в среднем, 15 лет опыта) и обнаружили, что эти эксперты такж е нечувстви­
тельны к упущ ениям из дерева (см. табл. 5). Хайнс и Ванмарк (Hynes и
Vanmarcke, 1976) попросили семерых “всемирноизвестных” инженеров по
геотехнике предсказать высоту плотины, которая приведет к обвалу гли ня­
ного фундамента, и определить границы уверенности по этой оценке, кото­
рые были бы достаточно ш ироки, чтобы иметь 50% шанс включения дей­
ствительной высоты, приводящей к разрушению. Ни одни из границ, опре­
Факты против страха... 547
деленные этими людьми, в действительности, все-таки не включали истин­
ную высоту. Рисунок 4 показывает эти результаты.

Таблица 5. Нечувствительность экспертов к упущениям в дереве ошибок


“машина не заводится”
Средняя доля нарушений запуска по типу
Систе­ Топли­ Систе­ Злона­
Акку­ ма мерен­
вная ма Двига­ ные Другие
муля­ стар- систе­ зажи­ тель
тор тинга дейст­
Группа п ма гания вия
Несокращенное
дерево, обычные 93 0.264 0.195 0.193 0.144 0.076 0.051 0.078
испытуемые
Несокращенное 13 0.410 0.108 0.,096 0.248 0.051 0.025 0.060
дерево, эксперты
Сокращенное - - - 0.215 а
дерево 1, эксперты 16 0.483 0.229 0.073

аДолжно быть 0.441


Источник: (Fischhoff, Slovic и Lichtenstein, 1978).

Рис. 4. Пример чрезмерной уверенности в суждениях экспертов,


представленный неспособностью ошибочных линий вместить дей­
ствительное значение. Данные представляют оценки семи “всемир­
ноизвестных” инженеров по геотехнике относительно высоты пло­
тины, при которой она обвалится
548 ВОСПРИЯТИЕ РИСКА
Многомиллионное исследование безопасности реакторов (Комиссия по
атомному регулированию Соединенных Штатов, 1975), оценивая вероятность
плавления ядра в атомном реакторе, использовала ту ж е процедуру для уста­
новления границ уверенности, которая, как было показано в Главах 21 и 22,
давала высокую степень чрезмерной уверенности. Ф актически, “Комитет
Льюиса” заключил свой обзор исследования безопасности реакторов замеча­
нием, что, несмотря на огромные успехи этого исследования, “мы уверены,
что ряды ошибок преуменьшены. Мы не можем сказать, насколько. Основа­
ния для этого включают неадекватные базы данных, плохую статистическую
обработку неконтролируемое распространение неопределенностей в расчетах”
(Комиссия по атомному регулированию, США, 1978).
Дальнейшие эпизодические свидетельства чрезмерной уверенности мо­
гут бы ть обнаруж ены во многих других оценках технического риска
(Fischhoff, 1977а). Некоторые распространенные способы, по которым экс­
перты могут недосмотреть или неправильно вынести суждение о путях, ве­
дущ их к катастрофе, показаны в следующем списке:
Неспособность рассмотреть способы, по которым ошибки людей
могут воздействовать на технологические системы. Пример: из-
за неадекватного обучения и дизайна комнаты контроля, операто­
ры Three Mile Island неоднократно неправильно диагностировали
проблемы реактора и предпринимали несоответствующие действия
(Sheridan, 1980; Президентская Комиссия, 1979).
Чрезмернаяуверенность в текущих научных знаниях. Пример: ис­
пользование передачи цифровых данных стало повсеместным и бес­
контрольным даже до того, к ак ученые рассмотрели возможность
побочных эффектов, которые сегодня сделали ее сомнительным и
необратимым благом (Dunlap, 1978).
Неспособность оценить, как технологические системы функцио­
нируют в целом. Пример: DC-10 потерпел неудачу в нескольких
предыдущих полетах, так как его проектировщики не осознали, что
декомпрессия грузового отделения разрушит жизненно важные си­
стемы контроля (Hohenemser, 1975).
Медленное обнаружение хронических, совокупных воздействий.
Пример: хотя несчастные случаи с шахтерами уж е давно были при­
знаны к ак одна из цен за использование ископаемого растительно­
го топлива, воздействие кислотных дождей н а экосистему обнару­
живалось медленно.
Неспособность предвидеть ответные действия человека на меры
безопасности. Пример: частичная защита, которую дают дамбы и
плотины, приносит людям ошибочное ощущение безопасности и со­
действует разработке затопляемых территорий. Таким образом,
хотя наводнения и редки, ущерб от них настолько велик, что сред­
негодовая потеря в деньгах больше, чем перед тем, как дамбы были
построены. (Burton, K ates & W hite, 1978)
Факты против страха... 549
Неспособность предвидеть “нарушения обычной модели”, которые
одновременно поражают системы, спроектированные как неза­
висимые. Пример: так как электрические кабели, контролирующие
множественные системы безопасности реактора на Брауне Ферри,
Алабама, были пространственно не отделены, все пять систем экст­
ренного охлаждения ядра были одновременно повреждены одним
пожаром (Палата Представителей США, 1975; Jennergren & Keeney,
в печати).
Крушение дамбы Тетон в 1976 году дает еще один трагический пример
самоуверенности экспертов. Комитет по правительственным операциям
приписал эту катастрофу неоправданной уверенности инженеров, которые
были абсолютно уверены, что они решили многие серьезные проблемы, воз­
никавш ие во время строительства (Комитет по правительственным опера­
циям, 1976). Обычно, вероятность неудачи даже не вычисляется для новых
дамб, даже хотя 1 из 300 разрушается во время первоначального заполне­
ния резервуара.

И н ф о р м и р о в а н и е лю дей о р и с к е
Трудно определенно думать о риске. К сожалению, это совершенно необхо­
димо. Радиационный риск, медицинские побочные эффекты, профессио­
нальные болезни, заражение пищевых продуктов, токсичные химические
препараты и неправильное срабатывание различных устройств все больше
заполняют наш и газеты и наш и мысли. Поскольку управление этими рис­
ками жизненно важно для благосостояния индивида и общества, люди в на­
стоящее время настаивают на своем праве играть активную роль в процессе
принятия решений. К ак результат этого, промоутеры и ответственные лица
опасных предприятий сталкиваются с увеличивающимся давлением по воп­
росу информирования людей о риске, с которым они сталкиваются (см. рис.
5). Например, за последние годы:
Администрация по Продуктам и Лекарствам предписала делать ин­
формационные вкладыши для пациентов по лекарствам, отпускае­
мым по рецептам, количество которых растет.
Департамент жилищного строительства и городского развития на­
чал требовать от продавцов домов, построенных до 1950 года, ин­
формирования покупателей о присутствии свинцовых красок.
Предложенный закон об обязательствах федеральной продукции
отвел значительное место информированию покупателей и рабочих
о риске, с которым они могут, вероятно, столкнуться.
Белый Дом приказал Государственному секретарю по медицине, об­
разованию и благосостоянию разработать общую информационную
программу по влиянию радиационного воздействия на здоровье.
550 ВОСПРИЯТИЕ РИСКА
Несмотря на эти хорошие намерения, разработка информационной про­
граммы может быть довольно сложной. Делать это адекватно - означает
найти убедительные способы представления сложного, технического мате­
риала, что часто омрачается неопределенностью. Не только из-за иногда
слиш ком ограниченного отведенного времени, но такж е из-за того, что со­
общения должны противопоставлять предвзятое мнение слушателей (и,
возможно, неправильное мнение) о рассматриваемом риске его последстви­
ям . Например, в некоторых ситуациях неправильный личный опыт может
содействовать ошибочному чувству безопасности, тогда к а к при других об­
стоятельствах только обсуждение возможных неблагоприятных послед­
ствий может увеличить их кажущ ую ся угрозу. Более того, к ак продемонст­
рировали Росс и Андерсен (Глава 9), убеждения людей часто изменяются
медленно и показывают чрезвычайную устойчивость перед лицом опровер­
гающего свидетельства. Далее идет краткий обзор некоторых дополнитель­
ных проблем, с которыми сталкиваются информационные программы.

Рис. 5. Рисунок С. Харриса, 1979 The New Y orker Magazine (про­


дукты питания: риски, выгоды)
Факты против страха... 551
Важен формат предст авления
Определенная манера представления риска может иметь первостепенное
влияние н а восприятие и поведение. Например, деятельность, увеличиваю­
щая годовой шанс смерти от 1 на 10. 000 до 1,3 на 10. 000, вероятно, каза­
лась бы намного более рискованной, если бы была описана вместо этого как
дающая 30% -ное увеличение риска смертности. Образцы эффектов форма­
та из литературы представлены ниже.
Деревья ошибок. Разработчики деревьев ошибок, подобного тому, что на
рис.З, должны принимать многочисленные осмотрительные решения в от­
ношении того, как организовать и представить разнообразные источники
проблемы. Одно такое решение, которое явно дает незначительное разли­
чие в ответах, состоит в том, какое количество подробностей должно быть
предлож ено; Ф иш хоф ф , С ловик и Л и хтенш тейн (F isch h o ff, Slovic и
Lichtenstein, 1978) обнаружили сходное восприятие с различным уровнем
подробностей. Одно лиш ь упоминание ветви позволяло людям точно оце­
нить, насколько проблемной будет эта ветвь, описанная подробно. Однако,
объединяющие ветви (например, соединяющие пусковую систему и систе­
му заж игания в одну более широкую категорию) или расщепляющие ветви
(например, разделяющие систему заж игания на систему заж игания (неис­
правная катуш ка и свечи заж игания, см. рис. 3) и систему распределения
(неисправный распределитель и проводка)) все ж е давали разницу в отве­
тах. О данном наборе проблем судили к ак об объясняющем где-то на 30%
больше нарушений, когда он был представлен как две ветви, чем когда он
был представлен к ак одна ветвь.
Ремни безопасности. Вторая демонстрация значения формата презентации
идет из изучения отношений к использованию автомобильных ремней безо­
пасности (Slovic, Fischhoff & Lichtenstein, 1978). Рассматривая предыду­
щее исследование, демонстрирующее критическое значение вероятности
вреда в защитном действии пристегивания (Slovic, Fischhoff, Lichtenstein,
Corrigan & Combs 1977), Словик, Фишхофф и Лихтенштейн доказывали,
что нежелание людей добровольно надевать ремни безопасности может быть
вызвано предельно маленькой вероятностью попадания в аварию с леталь­
ным исходом во время единственной поездки. Поскольку такие аварии слу­
чаются только один раз на 3,5 млн личных поездок, а приводящее к нетру­
доспособности повреждение только один раз на 100. 000 личных поездок,
отказ надеть ремень безопасности может казаться вполне обоснованным.
Однако он выглядит менее здравым, если принять во внимание перспекти­
ву множественных поездок и рассмотреть существенную вероятность ава­
рии в какой-либо из поездок. За 50 лет вождения (около 40. 000 поездок)
вероятность смерти увеличивается до 0.01, а вероятность получить, по край­
ней мере, одно приводящее к нетрудоспособности повреждение до 0.33. В
экспериментальном исследовании Словик, Фишхофф и Лихтенштейн по­
552 ВОСПРИЯТИЕ РИСКА
казали, что люди, которых просили рассмотреть эту перспективу длиною в
ж изнь, отвечали в отношении ремней безопасности (и воздушных подушек)
более благосклонно, чем это делали люди, которых просили рассмотреть пер­
спективу единичных поездок. Будет ли сохранено и введено в поведение бла­
госклонное отношение к ремням безопасности, вызванное удлиненной вре­
менной перспективой, остается под вопросом.
Псевдоуверенность. Согласно “теории перспективы (prospect theory)”
(K ahnem an & Tversky, 1979b), исходы, которые лиш ь просто возможны,
недооцениваются в сравнении с исходами, которые получены с увереннос­
тью. К ак результат, любые защитные действия, которые уменьшают веро­
ятность вреда, скаж ем, с 0.01 до 0, будут оценены значительно выше, чем
действия, уменьшающие вероятность с 0.02 до 0.01.
Тверски и Канеман (Tversky и K ahnem an, 1981) отмечают, что умствен­
ной репрезентацией защ итных действий можно легко манипулировать с
целью изменения каж ущ ейся уверенности, с которой они предотвращают
вред. Например, страховой полис, который охватывает пожары, но не на­
воднения, можно было бы представить либо как полную защиту от специ­
фического риска пожаров, либо к а к сокращение в пределах общей вероят­
ности потери собственности. Теория перспективы предсказывает, что полис
будет казаться более привлекательным с точки зрения первой перспективы
(названной “псевдоуверенностью”), по которой он предлагает безусловную
защ иту от ограниченного набора проблем.
Мы проверили это предположение в контексте одного конкретного вида
защ иты - вакцинации. Было создано две формы “опросного листа по вак­
цинации” . Форма I (вероятностная защита) описывала болезнь, которая, как
ожидалось, охватит 20% населения, и в ней спрашивалось, желают ли люди
добровольно привиться вакциной, которая защищает половину из привив­
ш ихся. Согласно Форме II (псевдоуверенность), существовало две взаимо­
исключающ их и равновероятных разновидности болезни, каж дая из кото­
ры х, вероятно, охватит 10% населения; было сказано, что вакцинация даст
полную защ иту от одной разновидности и никакой защ иты от другой. Уча­
стники исследования были набраны по объявлению в студенческой газете
Университета ш тата Орегон. Половина из них получила Форму I, другая -
Форму II. После прочтения описания они оценивали вероятность того, что
они пройдут вакцинацию в такой ситуации, используя ш калу, ранжиро­
ванную от 1 (“почти наверняка не буду прививаться”) до 7 (“почти наверня­
к а буду прививаться”).
Х отя обе формы показывали, что вакцинация уменьшала общий риск
человека с 20% до 10% , мы ожидали, что она покаж ется более привлека­
тельной тем, кто получил Форму II (псевдоуверенность), чем тем, кто полу­
чил Форму I (вероятностная защита). Результаты подтвердили это предска­
зание: 57% тех, кто получил Форму I I , показали, что они пройдут вакцина­
цию, в сравнении с 40% тех, кто получил Форму I.
Факты против страха... 553
Эффект псевдоуверенности придает первостепенное значение контрасту
между сокращением и ликвидацией риска. К ак показали Тверски и Кане-
ман, это различие очень трудно оправдать на каких бы то ни было основани­
ях. Более того, манипуляции уверенностью, по-видимому, значительно вов­
лечены в разработку и описание других форм защиты (например, медицин­
ское лечение, страхование, деятельность по защите от наводнений и земле­
трясений).
Привязка. Один из наиболее общих артефактов презентации состоит в тен­
денции привязки суждений на изначально представленным значениям
(Poulton, 1968; Tversky & Kahneman, 1974,1). В другой разновидности экс­
перимента, представленного на рис. 2, Лихтенштейн и другие (1978) проси­
ли вторую группу людей оценить частоту смертей в США от каж дой из 40
причин. Однако, вместо того, чтобы сказать, что около 50. 000 людей еж е­
годно умирают в автомобильных авариях, этим испытуемым сообщили, что
около 1.000 ежегодных смертей происходит от электричества. Хотя оба со­
общения были точны, предоставление более маленькой цифры уменьшило
оценки респондентов по большинству частот. Подобная привязка к перво­
начальной цифре привела к тому, что оценки двух групп отличались в неко­
торых случаях в 5 раз.
Фишхофф и МакГрегор (Fischoff и McGregor, 1980) попросили людей
вынести суждение о смертности от разнообразных потенциальных причин,
используя один из четырех формально эквивалентных форматов (например,
сколько людей выжило на каждого, кто был поражен и умер? Сколько лю­
дей умрет из 100. 000 тех, кто был поражен?). В таблице 6 представлены их
суждения в общем формате и открывает даже более драматичные эффекты
влияния вопросительного суждения на восприятие риска. Например, ког­
да люди непосредственно оценивали количество смертей для гриппа (колон­
ка 1), их средний ответ был 393 смерти на 1. 000 случаев. Когда им сообщи­
ли, что 8 0 .0 0 0 .0 0 0 людей подхватывают грипп в обычный год, и попросили
их оценить количество тех, кто умирает (колонка 2), средний ответ респон­
дентов был 4. 800, представляющий смертельную норму только к ак 6 на
100. 000 случаев. Это незначительное изменение вопроса изменило оцени­
ваемую норму больше, чем в 60 раз. Подобные противоречия случаются и с
другими вопросами и другими видами риска.
Другие эффекты. Многочисленные другие эффекты формата были задоку­
ментированы в литературе по рискованному поведению. Например, обна­
ружилось, что люди оценивают опасные предприятия совершенно иначе,
когда они рассматривают их в парах, чем когда судят о них по отдельности
(G rether & P lott, 1979; Lichtenstein & Slovic, 1971; 1973). Фишхофф, Сло-
вик и Лихтенш тейн (Fischhoff, Slovic и Lichtenstein, 1980), Херши, Скоу-
мейкер (Hershey и Schoemaker, 1980) и Скоумейкер и Канрейтер (Schoemaker
и K unreuther, 1979) отметили, что решения о том, покупать ли страховой
полис, часто отменяются, когда проблема выглядит как выбор между учас-
554 ВОСПРИЯТИЕ РИСКА

Таблица б. Суждения о смертности при различных ответных моделях ,


геометрические средние значения.

Н орм а смерт ей на 100. 000 пораж енных


Оцененная Оцененное Оцененная Оцененное Д ейст ви­
Болезнь норм а количест во норм а количест во т ельная
смерт ное - т ех, кто выж ивания т ех, кто норма
ти ум рет выживет смерт нос­
ти
Грипп 393 в 26 511 1
Свинка 44 114 19 4 12
Астма 155 12 14 599 33
Венеричес­
кие болезни 91 63 8 111 50
Высокое
кровяное 535 89 17 538 76
давление
Бронхит 162 19 43 2.111 85
Беремен­ 13
ность 67 24 787 250
Диабет 487 101 52 5.666 800
Туберкулез 852 1.783 188 8.520 1.535
Автомо­
бильные 6.195 3.272 31 6.813 2.500
аварии
Инсульт 11.011 4.648 181 24.758 11.765
Сердечный
13.011 3.666 131 27.477 16.250
приступ
Рак 10.889 10.475 160 21.749 37.500

Примечания : четырем экспериментальным группам дали следующие ин­


струкции:
(а) Оцените количество смертей: сколько людей умирает н а каж ды е
100. 000 пораж енны х?
(б) Оцените количество тех, кто умер: X людей были поражены, сколько
из них умерло?
(в) Оцените количество выживш их: Сколько пораженных людей вы ж и­
ло н а каждого, кто умер?
(г) Оцените количество тех, кто вы ж ил: У людей умерло, сколько было
поражено, но выжило?
Ответы на вопросы (б), (в) и (г) были пересчитаны в количество смертей на
100. 000 пораженных для облегчения сравнения.
Источник: Fischoff & McGregor, 1980.
Факты против страха... 555
тием в рискованном предприятии или потерей меньшей суммы денег. По­
добные опции риска, описанные в терминах спасенных ж изней, могут быть
оценены совершенно иначе, будучи структурированными в терминах поте­
рянных жизней (Tversky & K ahneman, 1981). Дополнительные эффекты
формата и контекста можно обнаружить у Fischhoff, Slovic и Lichtenstein
(1980), K ahnem an и Tversky (1970), Slovic, Fischhoff и Lichtenstein (в печа­
ти) и Tversky и K ahneman (1981).
Такие незначительные различия в представлении риска могут иметь за­
метный эффект в том, как он воспринимается, и это наводит на мысль, что
те, кто ответственен за информационные программы, имеет значительные
возможности манипулирования восприятием. Более того, поскольку эти эф­
фекты не являю тся широко известными, люди неумышленно могут мани­
пулировать своим собственным восприятием посредством случайных реше­
ний о том, к ак организовать свои знания.

Сравнение р а зли ч н ы х видов риска может вводить в заблуждение.


Один из наиболее распространенных подходов к углублению понимания лю­
дей состоит в представлении количественных оценок для различных видов
риска. Предположительно, опыт, почерпнутый при рассмотрении подобных
данных, будет полезным для процесса принятия решений, к ак в масштабе
личности, так и общества. Вилсон (W ilson, 1979) заметил, что нам следует
“постараться измерить все наш и виды риска количественно... Тогда мы мог­
ли бы сравнить эти виды риска и решить, какие из них принять, а какие
отвергнуть” (с. 43). Лорд Ротшильд (Lord Rothschild, 1979) добавил: “Нет
смысла впадать в панику относительно рисков ж изни до тех пор, пока вы не
сравните те риски, которые вас беспокоят, с теми, которые нет, но, возмож­
но, должны беспокоить”.
Обычно, подобные рассуждения сопровождаются детально разработан­
ными таблицами и даже “каталогами рисков”, в которых представлены раз­
личные индексы смерти или нетрудоспособности для широкого спектра
ж изненных рисков. Так, Соуби (Sowby, 1965) обеспечил экстенсивные дан­
ные по риску в течение 1 часа, когда человек ему подвергается, показываю­
щие, например, что 1 час езды на мотоцикле так ж е рискован, как и 1 час
пребывания в 7 5-летнем возрасте. Вилсон (W ilson, 1979) разработал табли­
цу деятельностей (например, полет на 1.0 0 0 миль на реактивном самолете,
3 часа в угольной шахте), каж дая из которых рассматривается к ак увели­
чивающ ая годовой шанс смерти человека на 1 из 1 млн. Вилсон заявил, что
“эти сравнения помогают мне оценить риски, и мне представляется, что они
такж е могут помочь в этом и другим. Но важнейшее использование этих
сравнений должно помогать нам принимать решения, к ак нации, чтобы
улучшить наше здоровье и уменьшить норму несчастных случаев” (с. 45).
Подобным образом Коуен и Ли (Cohen и Lee, 1979) проранжировали многие
виды риска в терминах того, к ак они сокращают продолжительность ж и з­
556 ВОСПРИЯТИЕ РИСКА
ни, на основании предположения, что “при некотором приближении, поря­
док рисков (в этой таблице) должен быть порядком социальных приорите­
тов. Однако мы видим несколько важ ны х проблем, которые получили очень
незначительное внимание..., тогда к а к некоторые пункты в конце списка,
особенно включающие радиацию, привлекают огромное внимание” (с. 720).
Собственно говоря, сравнение рисков не есть процедура процесса приня­
тия решений. Оно не требует выведения особых заключений, скаж ем, по
контрасту между риском езды на мотоцикле и риском престарелого возрас­
та (Fischhoff, Lichtenstein, Slovic, Derby & Keeney, 1981). Более того, даже в
качестве помощи интуиции, сравнение рисков имеет ряд присущих огра­
ничений. Например, хотя некоторые люди чувствуют себя информирован­
ными, зная, что один взлет и приземление самолета сокращает продолжи­
тельность ж изни в среднем на 15 минут, другие оказываются совершенно
озадачены такой информацией. При приземлении, либо ты преждевремен­
но умреш ь (почти наверняка, больше, чем на 15 минут), либо не умрешь.
Д ля многих людей средние значения не охватывают адекватно сущность
подобных рисков. В самом деле, М акНейл, Вайшельбаум и Паукер (McNeil,
W eichselbaum и Pauker, 1979) обнаружили, что пациенты, сталкиваю щие­
ся с перспективой операции рака легких, так ж е интересовались возмож­
ной угрозой смерти во время операции, к а к и ее вкладом в продолжитель­
ность ж изни.
Следующее ограничение состоит в том, что краткие суммарные статис­
тические данные могут маскировать важ ные характеристики риска. Там,
где есть неуверенность или несогласие с фактами, представление точечных
оценок может внушать чрезмерную уверенность. Поскольку люди особен­
но интересую тся потенциалом катастроф ических несчастны х случаев
(Slovic, Fischhoff & Lichtenstein, 1980), необходимо некоторое указание ве­
роятности и величины предельных потерь. Другими характеристиками,
которые воздействуют на отношение людей к риску, но пренебрегаются в
статистических изложениях, являю тся добровольность, контролируемость,
осведомленность, непосредственность последствий, угроза будущим поко­
лениям, легкость сокращ ения риска и степень справедливости распределе­
н ия выгоды меж ду теми, кто подвергается риску (Slovic, F ischhoff &
Lichtenstein, в печати). Хотя некоторые ошибки, такие к ак упущение свя­
зей неопределенностей, легко исправить, определение того, к ак оценивать
потенциал катастрофы, справедливость и другие важные характеристики,
будет требовать серьезных исследовательских усилий.

Выводы
Информирование людей предупреждающими этикетками, вкладыш ами в
упаковку или экстенсивными программами СМИ - это все ж е только часть
гораздо большей проблемы помощи людям в том, к ак справляться с риском
и неопределенностями современной ж изни. Мы убеждены, что некоторая
Факты против страха... 557
ответственность леж ит на наш их ш колах. Учебный план общественных
ш кол должен включать материал, разработанный для того, чтобы обучить
людей тому, что наш мир является вероятностным, а не детерминистским,
и чтобы помочь изучить стратегии суждений и решений, чтобы иметь дело с
этим миром (Beyth-Marom & Dekel, в печати). Эти стратегии так ж е необхо­
димы для навигации в мире неопределенной информации, к ак геометрия и
тригонометрия - для навигации в мире физических объектов.

А т о м н а я э н е р ги я : и зу ч е н и е с л у ч а е в в о с п р и я т и я р и с к а
Нигде больше вопросы воспринимаемого риска не являю тся такими яр ки ­
ми или ставки такими высокими, как в полемике вокруг атомной энергии.
Этот раздел рассматривает эту полемику в свете только что сделанных вы ­
водов.

Общая проблема
Даже перед аварией на Три Майл Айленд атомная индустрия садилась на
мели враждебного общественного мнения. Значительное и упорное оппози­
ционное движение было в ответе за дорогостоящие отсрочки в лицензирова­
нии и сооружении новых атомных станций в Соединенных Ш татах и за по­
литическую суматоху в нескольких европейских государствах.
Неисправный реактор на Три Майл Айленд стимулировал предсказуе­
мый немедленный подъем в антиядерной лихорадке. Любая попытка пла­
нировать роль атомной энергии в энергетическом будущем нации должна
считаться с решающими факторами этой оппозиции и предвидеть ее даль­
нейший курс. Один ключ к разгадке леж ит в недавнем исследовании, пока­
зывающем, что образы потенциальных ядерных катастроф, которые сфор­
мировались в сознании антиядерной общественности, значительно отлича­
ются от оценок, выдвинутых многими техническими экспертами. Мы опи­
шем эти образы и поразмышляем об их происхождении, постоянстве и по­
следствиям.

Основные восприят ия
Анкетное исследование людей, противостоящих атомной энергии, показыва­
ет, что они судят о своей выгоде, как о достаточно низкой, а о своем риске -
как о неприемлемо большом (Fischhoff, Slovic, Lichtenstein, Read & Combs,
1978). Что касается выгодной стороны, то эти люди не видят атомную энер­
гию как жизненно важное звено в удовлетворении основных энергетичес­
ких потребностей (Р о к о т у , 1977); скорее, многие рассматривают ее как
дополнение к другим источникам энергии, которые сами являю тся адек­
ватными (или их можно сделать адекватными путем защиты). Что касается
риска, то атомная энергия вызывает большее чувство страха, чем почти
558 ВОСПРИЯТИЕ РИСКА
любая другая технологическая деятельность (Fischhoff и другие, 1978).
Некоторые приписывают эту реакцию боязни невидимого и необратимого
радиационного зараж ения, угрожающего раком и ущербом на генетичес­
ком уровне. Однако, использование диагностических рентгеновских лучей,
радиационной технологии, которая несет сходный риск, не так страшно.
Напротив, этот риск часто недооценивается (Slovic, Lichtenstein & Fischhoff,
1979). Ассоциация атомной энергии с ядерным оружием может объяснить
эти различие восприятия. Как результат ее насильственных истоков, к атом­
ной энергии относятся к а к к технологии, чей риск является неконтролиру­
емым, смертельным и потенциально катастрофическим. Эти характерис­
тики не ассоциируются с применением диагностических рентгеновских
лучей.
Когда люди, противостоящие атомной энергии, описывают свои менталь­
ные образы ядерной аварии и ее последствий, они обнаруживают ожида­
ние, что серьезная авария реактора вероятна при их ж изни, и в ее результа­
те могут быть сотни тысяч, даже миллионы смертей (Slovic, Fischhoff &
Lichtenstein, 1979; Slovic, Lichtenstein & Fischhoff, 1979).Также ожидает­
ся, что подобная авария может стать причиной непоправимого ущерба ок­
ружаю щ ей среде на огромной географической территории. Эти ожидания
драматически контрастируют с мнением атомной индустрии, что множ е­
ственные системы безопасности сделают ущерб минимальным.
Одним неизбежным последствием этого “расхож дения в восприятии”
является неопределенность и недоверие части общественности, считающей,
что риск значительно больше, чем говорят оценки экспертов (Kasper, 1979;
S ta rr & W hipple, 1980). Эксперты, в свою очередь, подвергают сомнению
рациональность общественности и осуждают “эмоциональность”, ставящую
в тупик технологический прогресс. В результате - резкая и иногда грубая
конфронтация.
Признание этого расхождения в восприятии привело к заявлению экс­
пертов, что общественность должна быть “образована” в отношении “реаль­
ного” ри ска атомной энергии. Один ан ал и ти к общественного м нения
(Р о к о т у , 1977) определил вопрос следующим образом:
Наибольшая проблема, мешающая искушенному суждению по этому вопросу, - это не­
достаток знаний и фактов. В такой обстановке ужасные рассказы, путаница и ирраци­
ональность часто одерживают верх. Только посредством подробного изучения фактов и
знаний люди могут узнать, какой выбор является реальным.... (с. 12)

Н аш а точка зрения состоит в том, что усилия, предпринятые, чтобы умень­


ш ить расхождение в восприятии, сталкиваю тся с более важными препят­
ствиями. Это заключение основано на двух ключевых аспектах проблемы,
техническом и психологическом.
Факты против страха... 559
Технические препят ст вия
Техническая реальность такова, что существует немного определенных ф ак­
тов, относящихся к вероятности серьезных повреждений реактора. Техно­
логия так нова, а рассматриваемые вероятности так малы, что точные оцен­
ки риска не могут быть основаны на эмпирическом наблюдении. Вместо это­
го, подобные оценки извлекаются из сложных математических моделей и
субъективных суждений.
Сложность представления оценок риска заставила многих критиков по­
ставить под сомнение их валидность (Bryan, 1974; Fischhoff, 1977; Prim ack,
1975). Главный интерес состоит в том, что важ ные инициирующие события
или пути, ведущие к нарушениям, могут быть упущены, что вызывет недо­
оценку риска. Другая проблема оценки надежности проектов реакторов -
это сложность принятия в расчет “нарушений общей модели”, в которых
мнимо независимые системы, разработанные таким образом, чтобы поддер­
живать друг друга, выходят из строя из-за одной непредвиденной общей при­
чины. Критик атомной энергии Джон Холдрен (John Holdren) скептичен
относительно обоснованности оценок редких катастроф и кратко излагает
техническую проблему так:
Сообщество экспертов разделилось в отношении возможного реализма ве­
роятностных оценок в пределах от 1 на 10.000 до 1 на 1 млрд за реакторный
год. Я среди тех, кто убежден в невозможности в принципе аргументиро­
вать цифры, настолько малые, к а к эти, убедительными теоретическими до­
водами. П ричина, по которой я придерживаюсь такого взгляда, прямая:
атомно-энергетические системы так сложны, что вероятность серьезных
ошибок, содержащихся в анализе безопасности, так велика, что может сде­
лать бессмысленной крошечную вычисленную вероятность аварии (Holdren,
1976, с. 21).

П сихологические препят ст вия


Общественную боязнь атомной энергии не следует рассматривать к а к ирра­
циональную. Частично она подпитывается осознанием того, что факты ос­
париваются, и что эксперты ошибались в прошлом, когда они облучали уве­
личенные миндалевидные железы или позволяли людям наблюдать испы­
тания ядерных бомб с близкого расстояния. Что можно подвергнуть сомне­
нию, так это степень, в которой фундаментальные способы мыш ления лю­
дей (такие к а к опора на эвристику доступности) приводят их к искаж ен­
ным взглядам. Конечно, риск атомной энергии покажется главным канди­
датом для предубеждения доступности из-за обширных репортажей в СМИ,
посвященных ему, и его ассоциации с яркими, легко воображаемыми опас­
ностями ядерной войны.
К ак было отмечено ранее, эвристика доступности подразумевает, что
любое обсуждение ядерных аварий может увеличить их воображаемоеть и,
560 ВОСПРИЯТИЕ РИСКА
таким образом, их воспринимаемый риск. Рассмотрим инженера, доказы ­
вающего безопасность размещ ения ядерных отходов в солевых ш ахтах пу­
тем указания на невероятность разнообразных способов случайного выбро­
са радиации (рис. 1). Вместо того чтобы успокаивать аудиторию, эта презен­
тация может заставить их подумать: “Я и не представлял себе, что проблем
может быть так много”. В этом случае, опора на запоминаемость и вообра-
жаемость может затуманить различие между тем, что отдаленно возможно,
и тем, что вероятно. К ак жаловался один сторонник использования атом­
ной энергии: “Когда непрофессионалы обсуждают то, что могло бы случить­
ся, они иногда даж е не беспокоятся о том, чтобы использовать слова “могло
бы ” ( Cohen, 1974, с. 36). Другой аналитик рассмотрел подобную тему в не­
правильной интерпретации сценариев “наихудшего”:
Часто не было большой разницы, насколько странным или невероятным
было предположение в анализе подобного рода, поскольку нужно было все­
го лиш ь показать, что некоторый нежелательный эффект может иметь мес­
то с уровнем вероятности выше нуля. Оппоненты предложенной операции
могли очень просто ее разрушить, применив свое воображение, чтобы пред­
ставить набор условий, которые хотя и могут быть, к а к признано, предель­
но невероятными, способны привести к нежелательным результатам. С пре­
обладанием таких отношений планирование данной ядерной операции ста­
новится... опасным ( Cohen, 1972, с. 55).

Выводы
Х отя излож енная выше дискуссия определила некоторые возможные ис­
точники расхождения восприятия сторонников и противников использова­
ния ядерной энергии, она не указала определенно на одну или другую сто­
рону к а к имеющую наиболее точные оценки общего риска атомной энер­
гии. Эффекты запоминаемости и воображаемости способны к ак усилить об­
щественные опасения, так и сделать неясной осведомленность экспертов от­
носительно ситуаций, в которых система может выйти из строя. Поскольку
о действительном риске можно никогда не узнать с большой точностью, а
новая информация имеет тенденцию быть интерпретированной таким об­
разом, чтобы быть совместимой с предыдущими убеждениями человека, рас­
хождение восприятии может оставаться довольно долгое время. Так, для
некоторых людей Три Майл Айленд “доказал” возможность катастрофичес­
кого плавления, тогда как для других - подтвердил их веру в надежность
систем множественной безопасности и сдерживания.

К ому реш ать?


Исследование, описанное в этой главе, демонстрирует, что суждения о рис­
ке ошибочны. Оно такж е показывает, что степень ошибочности часто нео­
жиданно велика, и что ошибочных оценок можно придерживаться с боль­
Факты против страха... 561
шой уверенностью. Поскольку даже хорошо проинформированные непро­
фессионалы испытывают трудности, вынося точное суждение о риске, есть
искушение сделать заключение, что общественность следует отстранить от
процессов оценки и принятия решений риска в обществе. Подобное действие
было бы неправильным по нескольким основаниям. Во-первых, присталь­
ное рассмотрение показывает, что люди все-таки воспринимают некоторые
вещи достаточно хорошо, хотя их понимание часто может довольно сильно
отличаться от понимания технических экспертов. В ситуациях, где сильно
распространено неправильное понимание, след ошибок людей может идти
к предубежденному опыту, которому может противостоять образование. В
некоторых случаях след сильных опасений людей и их сопротивление убеж­
дениям экспертов может идти от их чувствительности к потенциалу катаст­
рофических несчастных случаев, от их осведомленности о несогласии экс­
пертов в отношении вероятности и величины таких несчастных случаев и
от их знаний о серьезных ошибках, сделанных экспертами в прошлом. Даже
в сложных случаях, таких к ак конфликт вокруг атомной энергии, атмос­
фера доверия и признания того, что и эксперты, и непрофессионалы могут
сделать свой вклад, может позволить некоторый обмен информацией и уг­
лубление перспектив.
Более того, во многих, если не в большинстве случаев, эффективное уп­
равление риском требует сотрудничества большого количества непрофес­
сионалов. Эти люди должны соглашав ься на отсутствие некоторых вещей и
принимать заместители других; они должны благоразумно голосовать по
поводу избирательных мер и за законодателей, которые будут служ ить им
как суррогатные менеджеры риска; они должны подчиняться правилам
безопасности и ответственно пользоваться правовой системой. Даже если
эксперты были лучшими судьями в отношении риска, чем непрофессиона­
лы, наделение экспертов эксклюзивным правом голоса в управлении риска
означало бы замещение краткосрочной действительностью долгосрочных
попыток, необходимых для создания информированного гражданского на­
селения.
Результаты, которые мы обсудили, ставят перед не-экспертами важную
серию проблем: быть лучше информированными, меньше полагаться на не­
рассмотренные и не поддержанные суждения, осознавать факторы, которые
могут оказывать влияние на суждения о риске и быть более открытыми к но­
вым свидетельствам; если кратко, осознавать потенциал образованности.
Перед экспертами и деятелями политики эти результаты ставят, возмож­
но, более сложную проблему: осознать и принять собственные когнитивные
ограничения, попытаться обучать, не пропагандируя, признать законность
интересов общественности и каким-то образом разработать способы, посред­
ством которых эти интересы могли бы найти выражение в общественных
реш ениях, не производя в процессе больше ж ара, чем света.
Часть X
Постскриптум
34. К вопросу о статистической интуиции*

Даниелъ Канеман и Амос Тверски

Больш ая часть вышедшей недавно литературы по суждениям и интуитив­


ным размыш лениям рассматривала ошибки, предубеждения и заблужде­
ния в разнообразии мыслительных задач (см., например, Einhorn & H ogart,
1981; H am m ond, M cClelland & M umpower, 1980; N isbett & Ross, 1980;
Shweder, 1980; Slovic, Fischhoff & Lichtenstein, 1977; Tversky & Kahneman,
1974,1). А кцент на изучении ошибок является характерным для исследо­
вания суждений человека, но оно не уникально в этой области: мы исполь­
зуем иллю зии, чтобы понять принципы нормативного восприятия, и мы
рассматриваем память, изучая процесс забывания. Однако ошибки рассуж­
дений уникальны среди когнитивных сбоев в двух существенных отноше­
ниях: Они несколько смущают, и их, по-видимому, избегают. Нас не беспо­
коит наш а чувствительность к вертикально-горизонтальной иллюзии или
наш а неспособность запомнить ряд из более, чем 8 цифр. И наоборот, ошиб­
ки рассуждения часто приводят в замешательство - либо от того, что реше­
ние, которое мы были не способны найти, оказалось достаточно очевидным
в ретроспективе, либо от того, что сделанная нами ошибка осталась привле­
кательной, хотя мы знаем, что это была ошибка. Многие текущие исследо­
вания суждений интересуются проблемами, которые имеют одну или дру­
гую из этих характеристик.
Наличие ошибки суждения демонстрируется сравнением ответов людей
либо с установленным фактом (например, что две линии одинаковы по дли­
не), либо при помощи принятого правила арифметики, логики или статис­
тики. Однако, не каж ды й ответ, который оказывается противоречащим ус­
тановленному факту или принятому правилу, является ошибкой суждения.
Противоречие может исходить такж е от неправильного понимания вопроса
испытуемым или от неправильной интерпретации ответа исследователем.

*Эта глава первоначально появилась в Cognition, 1 9 8 2 , 1 1 , 123-141. Авторские права©1981


принадлежат Elsevier Sequoia. Печатается в соответствии с разрешением.
566 ПОСТКРИПТУМ
Описание определенного ответа как ошибки суждения, следовательно, вклю­
чает предположения о коммуникации между экспертом и испытуемым. (Мы
вернемся к этому вопросу позже.) Изучающему суждение следует избегать
чрезмерно строгих интерпретаций, которые трактуют разумные ответы как
ошибки, равно как и снисходительных интерпретаций, которые пытаются
рационализировать каж ды й ответ.
Х отя ошибки суждения являю тся еще и методом, посредством которого
изучаются некоторые когнитивные процессы, этот метод стал значитель­
ной частью сообщения. Накопление демонстраций того, к ак умные люди
нарушают элементарные правила логики или статистики, подняло сомне­
ния относительно описательной адекватности рациональных моделей суж ­
дения и принятия решений. В течение двух десятилетий после Второй Ми­
ровой Войны несколько описательных трактовок реального поведения были
основаны н а норм ативны х моделях: теория субъективной ож идаемой
пользы в анализах рискованного выбора, исчисления Байеса в исследова­
нии изменений в убеждениях и теория обнаружения сигналов в исследова­
н иях психофизиологических задач. Теоретический анализ этих ситуаций
и, в гораздо меньшей степени, экспериментальных результатов, предложил
образ людей к а к эффективных, почти оптимальных в принятии решений.
Н а этом фоне наблюдения элементарных нарушений логических или ста­
тистических рассуждений каж утся неожиданными, и эта неожиданность,
возможно, поддержала мнение о человеческом интеллекте, которое некото­
рые авторы критиковали к ак несправедливо негативное (Cohen, 1979,1981;
Edwards, 1975; Einhorn & H ogart, 1981).
Существуют три связанные причины фокусировки на систематических
ош ибках и предубеждениях вывода в исследовании рассуждений. Во-пер­
вых, они показываю т некоторые наш и ограничения и предлагают способы
улучш ения качества нашего мыш ления. Во-вторых, ошибки и предубеж­
дения часто обнаруживают психологические процессы и эвристические про­
цедуры, которые руководят суждением и выводом. В-третьих, ошибки и
заблуждения помогают составить карту интуиции человека, указы вая, к а ­
кие из принципов статистики или логики являю тся не-интуитивными или
контр-интуитивными.
Термины интуиция и интуитивный использовались в трех различных
смыслах. Во-первых, суждение называется интуитивным, если оно достиг­
нуто при помощи неформальной и неструктурированной модели рассужде­
ний, без использования аналитических методов или обдуманных вычисле­
ний. Например, большинство психологов следуют интуитивной процедуре
в принятии решений относительно размера своих выборок, но применяют
аналитические процедуры, чтобы проверить статистическое значение сво­
их результатов. Во-вторых, формальное правило или ф акт природы яв л я ­
ется интуитивным, если он совместим с нашей непрофессиональной моде­
лью мира. Так, интуитивно очевидно, что вероятность выиграть приз в ло­
терее уменьшается с увеличением количества билетов, но контр-интуитив-
К вопросу о статистической интуиции 567
но, что есть хоть какой-то шанс, что группа из 23 человек будет включать
двух человек, родившихся в один день. В-третьих, о правиле или процедуре
говорят, что они являю тся частью нашего интуитивного репертуара, когда
мы применяем правило или следуем процедуре в нашем обычном поведе­
нии. П равила грамматики, например, являю тся частью интуиции носите­
ля язы ка, и некоторые (хотя и не все) из правил линейной геометрии явл я­
ются включенными в наше пространственное мышление.
Настоящая глава обращается к некоторым методологическим и концеп­
туальным проблемам, которые поднимаются при попытках составить карту
интуиции людей относительно шанса и неопределенности. Мы начинаем с
различных проверок статистической интуиции; затем мы обратимся к кри­
тике вопросно-ответной парадигмы в исследовании суждений; а закончим
обсуждением не-интуитивного характеранекоторых статистических законов.

Задачи на статистическую интуицию


Ошибки и предубеждения суждений в условиях неопределенности являются
основным источником данных для очертания границ статистической интуи­
ции людей. В этом контексте поучительно различать ошибки применения и
ошибки понимания. Неудача в конкретной проблеме называется ошибкой
применения, если есть свидетельство того, что люди знают и принимают пра­
вило, которое они не применили. Неудача называется ошибкой понимания,
если люди не признают валидности правила, которое они нарушили.
Ошибка применения наиболее убедительно демонстрируется, когда че­
ловек самопроизвольно или с минимальной подсказкой хватается за голову
и восклицает: “К ак я мог это упустить?” Хотя многие читатели узнают этот
опыт, подобное выражение эмоций не может идти в счет, и должны быть
разработаны другие процедуры, демонстрирующие, что люди понимают пра­
вило, которое нарушили.
Понимание правила можно проверить (1) выявлением оснований для дей­
ствий испытуемых или (2) просьбой подтвердить утверждение (1) общего
правила или (2) довода за или против конкретного заключения. Комбина­
ция этих характеристик дает четыре процедуры, которые мы сейчас проил­
люстрируем и обсудим.
Мы начинаем с неформального примера, в котором понимание правила
подтверждается принятием или подтверждением довода. Один из нас пред­
ставил следующий вопрос игрокам в сквош.
Как вы знаете, играть в сквош можно либо до 9, либо до 15 очков. При сохранении всех
остальных правил игры неизменными, если А - игрок лучший, чем В, какая из систем
очков даст А лучший шанс на выигрыш?

Х отя все наш и испытуемые обладали некоторыми знаниями по статис­


тике, большинство из них сказало, что система очков не имела бы никакой
разницы. Затем их попросили рассмотреть довод, что лучш ий игрок пред­
568 ПОСТКРИПТУМ
почел бы более долгую игру, поскольку атипичный исход менее вероятен в
большой выборке, чем в маленькой. С очень малым количеством исключе­
ний респонденты немедленно приняли довод и отметили, что их первона­
чальны й ответ был ошибкой. Очевидно, наш и испытуемые имели какое-то
представление о овоздействии размера выборки на ошибки осуществления
выборки, но они не смогли раскодировать длину игры в сквош к ак пример
размера выборки. Тот факт, что правильное заключение стало неизбежны-
мым, к а к только была установлена эта связь, показывает, что начальный
ответ был ошибкой применения, а не понимания.
Более систематическая попытка диагностики природы ошибки была осу­
ществлена в исследовании феномена, обозначенного как эффект конъю нк­
ции (см. Главу б). Возможно, самым элементарным принципом теории ве­
роятности является правило конъю нкции, которое утверждает, что вероят­
ность конъю нкции (А&В) не может превысить ни вероятность А, ни вероят­
ность В. Однако, к ак показывает следующий пример, возможно сконструи­
ровать задачи, в которых большинство судей - даже в высокой степени ис­
куш енных - утверждает, что конъю нкция событий более вероятна, чем один
из его компонентов.
Чтобы вызвать эффект конъю нкции, мы предоставили испытуемым опи­
сания людей, подобные помещенному ниже:
Линде 31 год, она не зам уж ем , искренна и умна. Она занимается в основном философи­
ей. Будучи студенткой, она серьезно интересовалась вопросами дискриминации и со­
циальной справедливости, а такж е участвовала в антиядерных демонстрациях.

По одному варианту проблемы, респондентов спрашивали, которое из


двух утверждений о Линде было более вероятно: (А) Линда - кассир в бан­
ке; (В) Линда - кассир в банке, который активно участвует в феминистском
движ ении. В большой выборке статистически неискуш енных студентов
последнего курса 86% вынесли суждение, что второе утверждение более
вероятно. В выборке выпускников-психологов только 50% допустили эту
ошибку. Однако разница между статистически неопытными и опытными
респондентами исчезала, когда эти два критических вопроса были внедре­
ны в список из восьми сравнительных утверждений о Линде. Более 80%
обеих групп демонстрировали эффект объединения. Сходные результаты
были получены внутригрупповом экспериментальном плане, по которому
критические категории сравнивались косвенно (см. Главу 6).
Задачи подтверждения правила и подтверждения довода были использо­
ваны в попытке определения того, понимают и принимают ли люди прави­
ло конъю нкции. Сначала мы представили группе статистически необучен­
ных студентов колледж а несколько похожих на правила утверждений, ко­
торые они должны были классифицировать как правдивые и ложные. Ут­
верждение: “Вероятность X всегда больше, чем вероятность X и Y” было
подтверждено 81% респондентов. Д ля сравнения, только 6% подтвердило
утверждение “Если А более вероятно, чем В, то они не могут произойти оба”.
К вопросу о статистической интуиции 569
Эти результаты показывают некоторое понимание правила конъюнкции,
хотя подтверждение не единогласное, возможно, из-за абстрактной и нео­
бычной формулировки.
Такж е использовалась процедура подтверждения довода, в ходе которой
респондентам дали описание Линды с последующими утверждениями (А) и
(В) и попросили проверить, какой из следующих доводов они рассматрива­
ют как правильный:
(i) А более вероятно, чем В, потому что вероятность того, что Линда и кассир в банке и
активная феминистка, должна быть меньше, чем вероятность того, что она кассир в
банке.
(ii) В более вероятно, чем А, потому что Линда похожа на кассира в банке, активно уча­
ствующую в феминистском движении, больше, чем на кассира в банке.

Довод (i), благоприятствующий правилу конъюнкции, был подтвержден


83% аспирантов-психологов, но только 43% статистически неопытных сту­
дентов. Обширные обсуждения с респондентами подтвердили эту модель.
Статистически обученные респонденты немедленно признали валидность
правила конъю нкции. Необученные респонденты, с дугой стороны, были
гораздо менее впечатлены нормативными доводами, и многие остались при
своих первоначальных ответах, которые не согласовывались с правилом
конъюнкции.
К нашему удивлению, необученные испытуемые не глубоко понимаем
правило конъю нкции; они были склонны подтверждать его абстрактно, но
не тогда, когда оно противоречило сильному ощущению репрезентативнос­
ти. С другой стороны, статистически обученные испытуемые признали ва­
лидность правила и были способны применить его в особенно ясной пробле­
ме. Однако, статистическая искушенность не предотвращала появления эф­
фекта конъю нкции в менее ясных вариантах той ж е проблемы. В терминах
настоящей трактовки, эффект конъю нкции оказывается ошибкой приме­
нения, по крайней мере, для более обученных испытуемых. Д ля более пол­
ного обсуждения этого вопроса, см. Главу 6.
В попытке описать етатистичекую интуицию людей при различных уров­
нях обученности Нисбетт, Кранц, Джепсон и Фонг (N isbett, K rantz, Jepson
& Fong, Глава 32, этого издания) использовали процедуру извлечения, со­
гласно которой респондентам требовалось оценить и оправдать определен­
ные заклю чения и выводы, относящиеся к персонажам кратких рассказов.
Исследователи наблюдали большие индивидуальные различия в понима­
нии основных статистических принципов, которые высоко коррелировали
с уровнем статистической обученности. Естественно, статистическая инту­
иция зависит от ума, опыта и образования. Как и в других формах знания,
то, что интуитивно для эксперта, часто не-интуитивно для новичка (см.,
например, Larkin, M cDermott, Simon & Simon, 1980). Несмотря на это, не­
которые статистические результаты (например, совпадение дней рождения
или смена “орлов” и “реш ек” в игре по подбрасыванию монет) остаются
570 ПОСТКРИПТУМ
контр-интуитивны ми даж е для изучаю щ их теорию вероятности (Feller,
1968, с. 85). Далее, существуют свидетельства, что ошибки (например, про­
игры ш азартного игрока), которые обычно совершаются неопытными рес­
пондентами, можно такж е обнаружить у статистически обученных респон­
дентов при решении более тонких проблем (Tversky & Kahneman, 1971,2).
Метод вы явления причин был такж е использован (Evans & W ason, 1976;
W ason & Evans, 1975) в исследованиях логической интуиции в хорошо из­
вестной задаче четырех карточек (Wason, 1966). По стандартному вариан­
ту этой задачи, экспериментатор предъявляет четыре карточки, показывая
А, Т, 4 и 7, и просит испытуемых показать карточки, которые следует пере­
вернуть, чтобы проверить правило: “Если карта имеет гласную букву с од­
ной стороны, она имеет четное число с другой”. Правильный ответ - необхо­
димо проверить карты А и 7, поскольку нечетное число на одной карте или
гласная буква на второй опровергли бы правило. Будучи поразительно не­
способными логически рассуждать, большинство испытуемых выбрали для
осмотра карты А и 4 Нейзон и Эванс (Nason & Evans) исследовали различ­
ные варианты этой задачи и требовали, чтобы их испытуемые приводили
причины или доводы своих решений по поводу того, осматривать или нет
обратную сторону каждой из четырех карт. Исследователи сделали заклю­
чение, что доводы, которыми испытуемые оправдывали свои ответы, были
всего лиш ь рационализацией, а не формулированием правил, которые дей­
ствительно руководили их решениями.
О другом свидетельстве неадекватного понимания людьми правил вери­
ф икации сообщали Вазон (W ason, 1969) и Вазон и Джонсон-Лэйрд (Wason
и Johnson-Laird, 1970). Чтобы обеспечить “терапию”, эти исследователи ста­
вили испытуемых перед последствиями их суждений и обращали внима­
ние испытуемых на непоследовательность их ответов. Эта процедура имела
незначительное воздействие на последующее выполнение той ж е задачи.
Взятые вместе, результаты наводили на мысль, что трудности людей в зада­
че верификации отражают недостаток понимания, а не применения.
Примеры, которые мы пока рассмотрели, включали подтверждение пра­
вил или доводов и выявление доводов, оправдывающих конкретный ответ.
Мы не обсуждали процедуру описания респондентами релевантного прави­
ла, поскольку подобная проверка часто чрезмерно требовательна: мы мо­
жем приписать людям понимание правил, которые они не могут должным
образом выразить.
Предпочитаемые процедуры для установления ошибок применения тре­
буют сравнения ответов людей в конкретном случае с их суждением о реле­
вантном правиле и ли доводе (M cClelland & R ohrbaugh, 1978; Slovic &
Tversky, 1974). Подтвердить ошибку применения можно такж е и при дру­
гих планах исследований. Например, Хемилл, Вилсон и Нисбетт (Hamill,
W ilson и N isbett, 1980) показывали испытуемым видеозапись интервью,
якобы взятое у тюремного надзирателя. Половине испытуемых было сказа­
но, что мнения надзирателя (очень гуманного или довольно грубого) были
К вопросу о статистической интуиции 571
типичны для тюремного персонала, тогда к а к другим испытуемым сказа­
ли, что отношения надзирателя были атипичны, и что он был либо намного
более, либо намного менее гуманен, чем большинство его коллег. Затем ис­
пытуемые оценивали типичные отношения тюремного персонала по разно­
образным вопросам. Неожиданным результатом было то, что мнения, вы­
раженные атипичным надзирателем, имели почти такое ж е влияние на обоб­
щение, что и мнения, приписанные типичному члену группы. Очевидно, в
этой модели суждения что-то не правильно, хотя невозможно описать лю­
бое конкретное суждение как ошибочное, и маловероятно, что многие из
испытуемых осознали бы, что они не находились под влиянием информа­
ции о типичности надзирателя (N isbett & W ilson, 1977). В этом случае и в
других внутригрупповых исследованиях, явно благоразумно будет заклю­
чить, что была допущена ошибка применения, если межгрупповое сравне­
ние выдает результат, который большинство людей рассматривает к а к не­
прочный.
Мы определили ошибку применения к а к ответ, нарушающий валидное
правило, которое индивид понимает и принимает. Однако часто сложно оп­
ределить природу ошибки, так к а к различные проверки понимания и при­
нятия правила могут давать различные результаты. Более того, одно и то
ж е правило может нарушаться в одном контексте проблемы и не наруш ать­
ся в другом. Задача верификации обеспечивает поразительный пример: ис­
пытуемые, которые неправильно проверили правило “Если карточка имеет
гласную букву с одной стороны, она имеет четное число с другой” не имели
никаких сложностей с проверкой формально эквивалентного правила: “Если
письмо с печатью, то на нем пятицентовая м ар ка” (см. Johnson-L aird,
Legrenzi & Sonino-Legrenzi, 1972; Johnson-Laird & W ason, 1977; W ason &
Shapiro, 1971).
Эти результаты иллюстрируют типичную модель в изучении рассужде­
ний. Оказывается, что люди не обладают общим валидным правилом для
проверки условных утверждений, иначе они реш или бы задачу карточек.
С другой стороны, они не слепы в отношении правильного правила, иначе
они такж е не смогли бы справиться с задачей марки. У тверждение, что люди
не обладают правильной интуицией, является, строго говоря, правильным,
если под применением правила имеется в виду то, что ему всегда следуют.
С другой стороны, это утверждение может вводить в заблуждение, посколь­
ку оно может навести н а мысль о более общем дефиците, чем тот, который
фактически наблюдается.
Некоторые заклю чения ранних исследований репрезентативности, ока­
зывается, имеют сходный статус. Было продемонстрировано, что многие
взрослые не имеют общей валидной интуиции, соответствующей закону
больших чисел, роли базовых значений в выводе Байеса или принципам
регрессивного прогнозирования. Но не обязательно, что каж дая задача, для
которой они будут релевантны, будет решаться неправильно, или что пра­
вила не могут оказаться неустойчивыми в особых контекстах.
572 ПОСТКРИПТУМ
Свойства, которые делают формально эквивалентные проблемы легки­
ми или трудными для решения, оказываются связанными с умственными
моделями, или схемами, которые эти проблемы вызываю т (R um elhart,
1979). Например, оказывается легче увидеть релевантность “не-q”в “р под­
разумевает q” в схеме контроля качества (Они забыли наклеить марку на
письмо, скрепленное печатью?), чем в схеме подтверждения (Подразумева­
ет ли отрицание заклю чения отрицание гипотезы?). Оказывается, что про­
цесс действительного рассуждения схематично или содержательно ограни­
чен таким образом, что различные операции или правила вывода доступны
в различных контекстах (Hayes & Simon, 1977). Следовательно, рассужде­
ние человека не может быть адекватно описано в терминах содержательно­
независимых формальных правил.
Проблема вы явления границ статистической или логической интуиции
далее усложняется возможностью достичь в высокой степени непредвиден­
ны х заклю чений серией высоко интуитивных шагов. Именно этот метод с
большим успехом использовал Сократ, чтобы убедить своих неопытных уче­
ников в том, что они всегда знали истину, которую он лиш ь заставил их об­
наружить. Следует ли любые заклю чения, которых можно достичь серией
интуитивных шагов, рассматривать к а к интуитивные? Брейн (Braine, 1978)
обсуждал этот вопрос в контексте дедуктивных рассуждений и предложил
в качестве проверки непосредственность: утверждение интуитивно только
тогда, когда его истинность является непосредственно данной, и если она
подтверждается одним шагом.
Вопрос Сократовых намеков точно не трактовался в контексте суждений
в ситуациях неопределенности, и нет правил, которые отличают справед­
ливые проверки интуиции от изобретательных загадок, с одной стороны, и
Сократовых инструкций - с другой. Представьте, например, к а к Сократ мог
учить своего ученика давать правильный ответ на следующий вопрос:
“В какой больнице, - большой или маленькой, - будут чаще отмечаться дни, когда бо­
лее 60% новорожденных будут мальчиками?”

Это сложный вопрос для студентов Стэнфорда (K ahnem an & Tversky,


1972, с. 441, 3), но правильный ответ может быть извлечен в серии легких
шагов, возможно таких:
“Не согласитесь ли вы, что дети, рожденные в конкретной больнице за конкретный день,
могут рассматриваться как выборка?”
“Совершенно верно. А теперь, одинаково ли вы уверены в результатах большой выбор­
ки и маленькой?”
“В самом деле. Не согласитесь ли вы, что ваша уверенность больше в выборке, которая
с меньшей вероятностью будет ошибочной?”
“Конечно, вы всегда это знали. Не скажете ли вы мне сейчас, какова пропорция маль­
чиков в совокупности детей, которую вы рассматриваете как ближайшую к идеалу ис­
тины?”
“Мы опять согласны. Разве это не означает тогда, что день, когда родилось более 60%
мальчиков, значительно удален от идеального?”
К вопросу о статистической интуиции 573
“Таким образом, если вы уверены в выборке, разве вам не следует ожидать, что она
скорее обнаружит правду, чем ошибку?” И т.д.

Сократова процедура - это очень неуклюжий способ направления рес­


пондента к желаемому ответу, но есть и более тонкие способы достижения
той ж е цели. Ф иш хоф ф , Словик и Л ихтенш тейн (F isch h o ff, Slovic и
Lichtenstein, 1979) показали, что испытуемые становятся чувствительны­
ми к базовым значениям и надежности свидетельства, когда они сталкива­
ются с последовательными проблемами, отличающимися только по этим
критическим переменным. Хотя эти исследователи не получили эффекта
размера выборки даже внутригрупповом экспериментальном плане, подоб­
ные эффекты были получены Эвансом и Дюзу аром (Evans и D u so ir, 877) и
Бар-Хиллел (Bar-Hillel, 1979) с более ясной формулировкой и более предель­
ными исходами по выборке.
Намек, обеспеченный параллельными проблемами, может привести к
тому, что испытуемые присвоят переменной значение, являющ ееся ирре-
левантным правильному ответу: Фишхофф и Бар-Хиллел (1980а) продемон­
стрировали, что респонденты были чувствительны к иррелевантной инфор­
мации о базовом значении, если это была лиш ь единственная переменная,
различаю щ ая набор проблем. В самом деле, испытуемые склонны верить,
что любое свойство данных, которое систематически изменяется, является
релевантным правильному ответу. Внутригрупповые проекты связаны с
многозначительными проблемами интерпретации в нескольких областях
психологических исследований (Poulton, 1975). В исследованиях интуиции
они обязаны вызывать эффект, который они намереваются проверить.

К в о п р о су об о г р а н и ч е н и я х в о п р о сн о -о тв етн о й п а р а д и г м ы
В предыдущем разделе мы указали на возможность того, что внутригруп­
повые планы и сократовы намеки могут подталкивать исследуемой интуи­
ции. В действительности проблема намного шире. Большинство исследова­
ний по суждениям в ситуации неопределенности и по индуктивным выво­
дам проводилось в разговорной парадигме, при которой испы туемы м
предъявляется информация, и их просят ответить на вопросы или оценить
значения, устно или письменно. В этом разделе мы обсудим некоторые слож­
ности и ограничения, связанные с этой вопросно-ответной парадигмой.
Использование коротких вопросников, заполняемых случайно мотиви­
рованными испытуемыми, часто критикуется на том основании, что испы­
туемые действовали бы иначе, если бы отнеслись к ситуации более серьез­
но. Однако свидетельства показывают, что ошибки рассуждения и выбора,
которые были первоначально установлены в гипотетических вопросах, не
ликвидирую тся предъявлением более основательных стимулов (Grether,
1979;G rether & P lott, 1979; Lichtenstein & Slovic, 1971, 1973; Tversky &
K ahnem an, 1981). Гипотетические вопросы являю тся подходящими тогда,
574 ПОСТКРИПТУМ
когда люди способны предсказать, к а к бы они отвечали в более реалистич­
ной обстановке, и когда у них нет никаких мотивов для лж и в своих отве­
тах. Это не говорит о том, что поощрения и стимулы не воздействуют на суж­
дения. Скорее, мы утверждаем, что ошибки рассуждения и выбора не исче­
зают с присутствием поощрений. Ни газеты, ни исследование прошлых по­
литических и военных решений не поддерживают оптимистического взгля­
да, что рациональность преобладает, когда ставки высоки (Janis, 1972; Janis
& M ann, 1977; Jervis, 1975).
Возможно, более серьезный интерес в отношении вопросно-ответной па­
радигмы состоит в том, что мы не можем безопасно предположить, что “эк­
спериментальные разговоры”, в которых испытуемые получают сообщения
и отвечают на вопросы, будут имитировать выводы, которые люди делают
при обычном взаимодействии со средой. Хотя некоторые суждения в повсед­
невной ж изни являю тся ответом на точные вопросы, многие не являются
таковыми. Более того, разговорные эксперименты во многом отличны от
обычного социального взаимодействия.
Интерпретируя ответы испытуемых, экспериментаторы находятся в ис­
куш ении предположить, (i) что вопросы только лиш ь вы являю т у испытуе­
мы х открытые вы раж ения мыслей, которые возникнут у них самопроиз­
вольно, и (ii) что вся информация, данная испытуемому, включена в экспе­
риментальное сообщение. С точки зрения испытуемого ситуация выглядит
несколько иначе. Во-первых, вопрос, который задает экспериментатор, мо­
ж ет возникать не самопроизвольно в ситуации, которую эксперт имитиру­
ет. Во-вторых, испытуемого обычно интересуют многие вопросы, которые
экспериментатор никогда и не думал задавать, такие как: Существует ли
правильный ответ на этот вопрос? Ожидает ли экспериментатор, что я его
обнаружу? Вероятно ли вообще, что очевидный ответ правилен? Дает ли
вопрос какие-либо намеки на ожидаемый ответ? Что определило отбор ин­
формации, предоставленной мне? Может ли часть ее быть иррелевантной,
чтобы ввести меня в заблуждение, или вся она релевантна? Единственный
открытый ответ, наблюдаемый экспериментатором, определяется частич­
но ответами испытуемого на эту группу подразумеваемых вопросов. И экс­
периментальное сообщение является лиш ь одним из источников информа­
ции, которую использует испытуемый для генерации к а к открытых, так и
скрыты х ответов (О т е , 1973).
Вслед за лекциями Грайса Вильяма Джеймса в 1967 году (Grice, 1975),
большой массив литературы по философии, лингвистике и психолингвисти­
ке имел дело с вкладом принципа кооперативности в значение изречений (для
справок см. Clark & Clark, 1977). Согласно этому принципу, слушатель в раз­
говоре имеет право предположить, что говорящий старается быть “информа­
тивным, правдивым, релевантным и понятным” (Clark & Clark, 1977, с. 560).
Грайс составил список нескольких принципов, которым обычно будет следо­
вать кооперативный говорящий. Например, принцип количества запрещает
говорящему говорить то, что слушатель уже знает или мог бы легко понять из
К вопросу о статистической интуиции 575
контекста или оставшейся части сообщения. Именно по этому принципу ут­
верждение “Джон пытался убрать в доме” выражает, что попытка была бе­
зуспешной: Слушатель может предположить, что успешная попытка была
бы описана более простым предложением: “Джон убрал в доме”.
Испытуемые приходят на эксперимент с опытом кооперативности в раз­
говоре, полученным в течение всей жизни. Они обычно ожидают увидеть
кооперативного экспериментатора, хотя это ожидание часто ошибочно.
Предположение кооперативности оказывает много еле уловимых эффектов
на интерпретацию испытуемых предоставляемой им информации. В осо­
бенности, оно делает исключительно сложным для экспериментатора ис­
следование эффектов “иррелевантной” информации. Поскольку представ­
ление иррелевантной информации нарушает правила разговора, вероятно,
испытуемые ищ ут релевантность в любом экспериментальном сообщении.
Например, Тейлор и Крокер (Taylor и Crocker, 1979) комментировали факт,
что впечатления испытуемых о человеке находились под влиянием утвер­
ждений, которые истинны для всех, например, “Марк скромен в отношени­
ях со своими профессорами”. Но вывод испытуемых о том, что Марк необы­
чайно скромен, может быть оправдан убеждением, что кооперативный экс­
периментатор не включил бы полное избыточное утверждение в описание
личности. Сходные вопросы поднимаются в других исследованиях (напри­
мер, Kahneman & Tversky, 1973; N isbett, Zukier & Lemley, 1981), которые
исследовали воздействие иррелевантной и ненужной информации.
Роль предположений, заложенных в вопросе, была проиллюстрирована
Лофтусом и Пальмером (Loftus и Palm er, 1974), которые показали, что сви­
детели давали более высокую оценку скорости машины, когда их спраши­
вали “К ак быстро ехала машина, когда она разбила вдребезги другую ма­
ш ину?”, чем когда вопрос был “К ак быстро ехала машина, когда она удари­
ла другую машину? ”. Использование в вопросе слова разбила подразумева­
ет, что задающий вопрос, если он откровенен и кооперативен, убежден, что
маш ина ехала быстро.
Нормативный анализ подобного вывода может быть разделен на две ста­
дии проблемы, (i) Должен ли свидетель находиться под влиянием вопроса,
формируя личное мнение относительно скорости машины? (ii) Должен ли
свидетель находиться под влиянием вопроса, формулируя общественную
оценку? Ответ на (i) должен быть положительным, если вопрос выражает
новую информацию. Ответ на (ii) менее ясен. С одной стороны, каж ется не­
подходящим для ответа, если он вторит информации, содержащейся в воп­
росе. С другой стороны, от кооперативного свидетеля ожидают, что он даст
наилучшую возможную оценку, отвечая на вопрос о количестве. Что ж е
делать свидетелю, если на эту оценку только что повлиял вопрос? Следует
ли ему ответить: “Перед тем, к ак вы спросили меня, я думал, ч т о ... ”? К аки­
ми бы ни были нормативные достоинства случая, свидетельства показыва­
ют, что люди часто неспособны изолировать прошлые мнения от настоящих
или оценить вес факторов, оказавш их воздействие на их взгляды (Fischhoff,
576 ПОСТКРИПТУМ
1977b; Goethals&Reckman, 1973; Nisbett&W ilson, 1977; Ross & Lepper, 1980).
Наше исследование привязки (Tversky & Kahneman, 1974, 1) далее ил­
люстрирует силу едва уловимых предположений. В одном исследовании мы
просили группу испытуемых оценить вероятность того, что население Тур­
ции было больше, чем 5 млн, а другую группу мы попросили оценить веро­
ятность того, что население Турции было меньше, чем 65 млн. Следуя этому
заданию, две группы записали свои наилучшие догадки относительно насе­
ления Турции; средние оценки были 17 и 35 млн, соответственно для групп,
которым представили низкие и высокие привязки. Эти ответы могут быть
такж е рационализированы предположением, что значения, которые появ­
ляю тся в вопросах о вероятности, не слишком далеки от правильных.
Мы доказывали, что эффекты предположения иногда могут быть оправ­
даны, поскольку нет ясного разграничения между предположением и ин­
формацией. Однако важно отметить, что люди не принимают предположе­
ния, потому что так нужно. Во-первых, они обычно не знают, что на них
повлияло предположение (Loftus, 1979; N isbett& W ilson, 1977). Во-вторых,
сходные эффекты предположения наблюдаются даж е тогда, когда респон­
денты не могут основательно верить, что привязка, данная им, несет инфор­
мацию. Испытуемые, которым требовалось дать оценки количества, регу­
лируя вверх или вниз от случайно генерированного значения, демонстри­
ровали сильное проявление эффектов привязки (Tversky & Kahneman, 1974,
1). Но неспособность предполагать, к ак таковая, является беспокойством, а
явн ая неспособность отвергать - неинформативные сообщения.
Когда испытуемым требуется указать свой ответ, выбрав ответ из списка
или построив распределение вероятности по данному набору альтернатив,
выбор категорий экспериментатором может быть информативным. Лофтус
(Loftus, 1979) показал, что респонденты сообщали о гораздо большем коли­
честве случаев головной боли в неделю, когда ш кала ответов была выраже­
на к а к 1-5, 5 -1 0 ,1 0 -1 5 и т.д ., чем когда ш кала была выраж ена к ак 1-3, 3-5,
5-7 и т.д. В этом случае ш кала могла законно влиять на границы того, что
должны назы вать головной болью. Даже когда такие повторные интерпре­
тации не являю тся возможными, можно ожидать, что испытуемые пред­
почтут среднюю часть области распространения в своих оценках количе­
ства и построят субъективное вероятностное распределение, в котором к аж ­
дая категория определена неявной вероятностью (Olson, 1976; Parducci,
1965).
П редположения, подразумеваемые опросником, могут такж е вносить
вклад в результаты, наблюдавшиеся Фишхоффом, Словиком и Лихтенш ­
тейном (1978), которые просили неопытных испытуемых и опытных авто­
механиков оценить вероятность различных неполадок, которые могут быть
причиной нарушений в запуске машины. Они обнаружили, что оцененная
вероятность категории “все другие проблемы” была достаточно нечувстви­
тельна к полноте списка и едва увеличилась, когда основной фактор (на­
пример, вся электрическая система) был удален из списка.
К вопросу о статистической интуиции 577
Даже едва уловимые и косвенные ключи к разгадке могут быть эффектив­
ны. В недавнем исследовании мы дали испытуемым следующую информа­
цию: “Мистер А - кавказец, 33 лет. Он весит 190 фунтов”. Одну группу испы­
туемых попросили угадать его рост. Другие испытуемые такж е пытались до­
гадаться о его росте, после того, к ак сначала пытались догадаться о размере
его талии. Средняя оценка была значительно выше в первой группе, пример­
но на один дюйм. Мы подозреваем, что испытуемые, сначала оценивавшие
размер талии приписали большую часть веса мистера А его обхвату, чем это
сделали испытуемые, которые только лишь угадывали его рост.
Мы заключаем, что разговорный аспект исследований суждений заслу­
ж ивает более тщательного рассмотрения, чем он получил в прошлых иссле­
дованиях, вклю чая наше собственное. Мы не можем всегда предполагать,
что люди сделают или должны сделать тот ж е вывод, наблюдая ф акт и слу­
ш ая сообщение об этом ж е факте, потому что правила разговора, которые
регулируют коммуникацию между людьми, не применимы к информации,
которая получена из естественного наблюдения. Часто трудно задавать воп­
росы, не давая (полезных или вводящих в заблуждение) ключей относитель­
но правильного ответа и не вы раж ая информации об ожидаемом ответе.
Обсуждение родственного нормативного вопроса, касающегося интерпре­
тации-свидетельства, включено в исследование Бар-Хиллел и Ф олк (Ваг-
Hillel и Falk, 1980).
Естественно, вероятно, что факторы предубеждения, упомянутые нами,
будут оказывать наибольшее воздействие в ситуациях высокой неопреде­
ленности. Испытуемые не будут придавать много значенияинтерпретаци-
ям разговорного отношения экспериментатора, если они будут противоре­
чить уверенному знанию правильного ответа на вопрос. Однако, в области,
где было проведено большинство исследований суждений, изменения раз­
говорного контекста могут воздействовать на процесс рассуждения так же,
как и на наблюдаемый ответ.

О ш и бки с у ж д ен и я: п о л о ж и т е л ь н ы й и о т р и ц а т е л ь н ы й а н а л и з
Часто полезно различать положительную и отрицательную стороны оши­
бок суждения. Положительный анализ концентрируется на факторах, ко­
торые производили частично неправильный ответ; отрицательный анализ
объясняет, почему не был дан правильный ответ. Например, положитель­
ный анализ ошибки ребенка в задаче П иаже пытается обозначить факторы,
которые определяют ответ ребенка, такие как относительная высота или пло­
щадь поверхности двух контейнеров. Отрицательный анализ того ж е пове­
дения сфокусировался бы на препятствиях, которые помешали ребенку
получить и понять сохранение объема. В исследовании суждений в ситуа­
циях неопределенности положительный анализ касается эвристики, кото­
рую используют люди в суждениях, оценках и предсказаниях. Отрицатель­
ный анализ связан со сложностями понимания и применения элементар­
578 ПОСТКРИПТУМ
ных правил рассуждения. В случае ошибки понимания отрицательный ана­
лиз фокусируется на препятствиях, которые мешают людям открыть реле­
вантное правило самим или принять простые его объяснения. Отрицатель­
ный анализ ошибки применения стремится идентифицировать способы, при
которых кодирование проблем может скрывать релевантность правила, ко­
торое известно и принято.
В общем, положительный анализ ошибки наиболее полезен тогда, когда
одна эвристика объясняет суждения в разнящ емся наборе проблем, где на­
рушаются различные нормативные правила. Соответственно, отрицатель­
ный анализ будет наиболее показательным, когда люди последовательно
наруш ают правило в различных проблемах, но совершают ошибки, кото­
рые нельзя отнести к одной эвристике. Тогда становится уместным вопрос,
почему люди не могут выучить правило, если рутинные наблюдения повсед­
невных событий предлагает достаточно возможностей для этого. Такж е ста­
новится уместным вопрос, почему люди сопротивляются правилу, если их
не убеждают простые валидные доводы. Сложности изучения статистичес­
к и х принципов на повседневном опыте обсуждались несколькими автора­
ми, наиболее полно Айнхорном, Хогартом (Einhorn и Hogart, 1978), Л.Р.Гол-
дбергом (L. R. Goldberg, 1968b), Нисбеттом и Россом (N isbett и Ross, 1980).
Неудачи научения обычно исходят из недоступности необходимого кодиро­
вания релевантных примеров или к отсутствию корректирующей обратной
связи по ошибочным суждениям. Сопротивление принятию правила обыч­
но приписывается его не-интуитивной природе. В качестве примера мы об­
ратимся теперь к анализу причин сопротивления правилу регрессивного
прогнозирования.
Исследования интуитивного прогнозирования обеспечили много свиде­
тельств преобладания тенденции делать прогнозы, которые являю тся ра­
дикальны ми или недостаточно регрессивными. (Недавний обзор этой лите­
ратуры см. в Главе 15). В более ранних статьях мы предлагали положитель­
ны й анализ этого эффекта как проявление репрезентативной эвристики
(K ahnem an & Tversky, 1973,4; 1979а, 30). Однако, как мы увидим, есть ос­
нования для того, чтобы обратиться к отрицательному анализу для более
понятной трактовки.
Отрицательный анализ представляет особый интерес в случае с ошибка­
ми понимания, при которых люди находят правильное правило не-интуи­
тивным или даже контр-интуитивным. Как засвидетельствует большинство
преподавателей элементарной статистики, студенты находят концепцию
регрессии очень сложной для понимания и применения, несмотря на ж и з­
ненный опыт, в котором крайние прогнозы было часто слишком крайними.
Спортивные тренеры и учителя, например, знакомы с проявлениями рег­
рессии к среднему: за исключительными достижениями чаще идет разоча­
рование, а за неудачами - улучшение.
Более того, когда регрессия критериальной переменной по предсказыва­
ющей переменной в действительности линейна, и когда условное распреде­
К вопросу о статистической интуиции 579
ление критерия (для фиксированных значений предсказывающей перемен­
ной) симметрично, правило регрессивного прогнозирования может быть за­
щищено непреодолимым доводом: имеет смысл сделать одинаковый про­
гноз для всех случаев, которые имеют одинаковое значение предсказываю­
щей переменной, и имеет смысл выбрать этот прогноз так, чтобы средняя
величина и медиана критериального значения, для всех случаев, которые
делят одинаковое предсказанное значение Y, равнялось Y. Это правило, од­
нако, противостоит другим видам интуиции, некоторые из которых обсуж­
даются в следующих абзацах.
1. “Оптимальное правило прогнозирования должно, по крайней мере,
позволять, если не гарантировать, совершенно точное прогнозирование для
целого набора случаев”. Принцип регрессивного прогнозирования наруш а­
ет это, по-видимому, благоразумное требование. Он выдает набор предска­
занных значений, который имеет меньшее различие, чем соответствующий
набор действительных значений критерия и, таким образом, исключает воз­
можность набора совершенно точных прогнозов. В самом деле, правило рег­
рессии гарантирует, что ошибка будет допускаться в каждой паре коррели­
рующ их наблюдений: мы никогда не сможем найти сына, чей рост был пра­
вильно предсказан по росту его отца, и такж е позволял точное прогнозиро­
вание роста отца, за исключением, когда оба значения находятся в середи­
не распределения роста. Странно, что правило прогнозирования, гаранти­
рующее ошибку, должно превратитьс т в оптимальное.
2. “Связь между наблюдением и основанным на нем прогнозированием
должна быть симметрична”. По-видимому, благоразумно ожидать, что, если
В предсказано по знаниям об А, тогда А должно быть соответствующим про­
гнозом, когда известно В. Регрессивное прогнозирование, конечно же, на­
рушает эту симметрию, поскольку прогнозирование двух переменных друг
от друга регулируется не одним я тем ж е уравнением регрессии. Родствен­
ная асимметрия встречается при сравнении регрессивного прогнозирования
с действительными значениями критериальной переменной. Регрессивное
прогнозирование не подвержено предубеждению, в том смысле, что среднее
критериальное значение, во всех случаях, для которых было предсказано
частное значение Y, ожидается к ак Y. Однако, если мы рассмотрим все слу­
чаи, для которых критериальное значение было Y, окажется, что среднее
значение их предсказанных показателей будет лежать между Y и группо­
вым средним значением. Эти асимметрии являю тся загадочными и контр­
интуитивными для сообразительных, но статистически неопытных людей.
Асимметрии регрессивного прогнозирования особенно проблематичны,
когда первоначальное наблюдение и критерий генерированы одним и тем
ж е процессом и априорно не отличаются, к ак в случае повторного осуще­
ствления выборки из той же совокупности или в случае параллельных форм
одного теста. Единственной моделью прогнозирования, которая удовлетво­
ряет симметрии в подобных ситуациях, является правило отождествления,
при котором показатели по второй форме предсказываются к ак такие ж е,
580 ПОСТКРИПТУМ
что и при первоначальном наблюдении. Принцип регрессивного прогнози­
рования представляет различие, для которого нет никаких очевидных ос­
нований: к ак можно предсказать знак разницы между двумя значениями,
выбранными из одной совокупности, как только становится известным одно
из этих значений?
3. “Любой системный эффект должен иметь причину”. Разница между
первоначальными наблюдениями и действительными критериальными зна­
чениями является фактом, который можно наблюдать при любом типе рас­
сеивания. Однако он оказывается эффектом без причины. Например, в си­
туации повторного теста знание о том, что первоначальные показатели были
высоки, влечет за собой прогнозирование, что последующие будут ни же, но
первое наблюдение не является причиной того, что второе будет ниже. По­
явление беспричинного эффекта нарушает вескую интуицию. В самом деле,
пониманию регрессии сильно мешает тот факт, что любому примеру регрес­
сии, с которым случайно сталкиваешься, вероятно, будет дано причинное
объяснение. Например, в к о н т е к с т умелого выполнения регрессия от пер­
воначального теста к последующему обычно приписывается напряженно­
му усердию после первой неудачи и чрезмерной уверенности, следующей за
первоначальным успехом. Часто трудно осознать, что выполняющие будут
регрессировать, далее не зная результатов, а только из-за непреодолимой
ненадежности своего выполнения. Регрессия первого выполнения по вто­
рому такж е удивительна, потому что ей нельзя дать простого причинного
объяснения.
Мы сделали набросок отрицательного анализа сложностей, которые ис­
пытываю т люди в понимании и применении концепции регрессивного про­
гнозирования. Мы предполагаем, что у людей есть сильная интуиция отно­
сительно статистического прогнозирования, и что некоторые нормативно
правильные принципы являю тся контр-интуитивными именно потому, что
они нарушают их существующую интуицию. С этой точки зрения, “прин­
ципы ” , которые люди принимают, представляют значительные убеждения,
а не только лиш ь рационализации, и они играют существенную роль в за­
медлении изучения верных правил. Однако эти убеждения часто являю тся
противоречивыми и, следовательно, непонятными. Например, невозмож­
но построить не-выражденное совместное распределение роста отцов и (пер­
вых) сыновей так, чтобы средний рост отца был бы объективным предска­
зывающим фактором роста сына, а рост сына был бы объективным пред­
сказываю щ им фактором роста его отца.
В заклю чении, мы предположили, что некоторые ошибки и предубежде
н и я в суж дениях в ситуациях неопределенности требуют двойственного
анализа: положительной стороны, которая объясняет выбор частного ош и­
бочного ответа в терминах эвристики, и отрицательной стороны, объясняю­
щ ей, почему правильное правило не было выучено. Хотя эти два анализа не
являю тся несовместимыми, они имеют тенденцию придавать большое зна­
чение различным аспектам изучаемого феномена. П опытка интегрировать
К вопросу о статистической интуиции 581
положительные и отрицательные стороны, похоже, обогатит теоретический
анализ индуктивного рассуждения.

Р е зю м е
В этой главе мы обратились к трем группам методологических и концепту­
альных проблем в области суждений в ситуациях неопределенности. Во-пер­
вых, мы сделали различие между ошибками применения и ошибками пони­
мания и обсудили различные методы изучения статистической интуиции. Во-
вторых, мы сделали обзор некоторых ограничений вопросно-ответной пара­
дигмы исследования суждений и исследовали эффекты мысленных предпо­
ложений, сократовых намеков и правил разговора. В-третьих, мы обсудили
роль положительных и отрицательных объяснений ошибок суждения.
Соображения, выдвинутые в этой главе, усложняют эмпирический и тео­
ретический анализ суждений в ситуациях неопределенности; они также пред­
лагают новые направления будущих исследований. Мы надеемся, что более
глубокая оценка концептуальных и методологических проблем, связанных
с изучением статистической интуиции, приведет к лучшему пониманию слож­
ностей, тонкостей и ограничений индуктивного рассуждения человека.
35. Варианты неопределенности*

Даниелъ Канеман и Амос Тверски

Понятие неопределенности в философии, статистике и теории принятия ре­


шений обычно трактуют для всех форм неопределенности в терминах еди­
ничного измерения вероятности или степени убежденности. Недавние пси­
хологические исследования принятия решений в условиях неопределеннос­
ти часто следовали этой традиции и фокусировались на соответствии интуи­
тивных суждений стандартной логике вероятности (Einhorn & Hogart, 1981;
N isbett& R oss, 1980; Slovic, Fischhoff & Lichtenstein, 1977; Глава 34). Всесто­
ронняя психологическая перспектива неопределенности, однако, открывает
разнообразие процессов и опыта, которые включают такие основные меха­
низмы, к ак привыкание к неоднократному стимулированию в отдельном ней­
роне, и такие сложные виды деятельности, как оценка научных гипотез.
В этой главе мы сделаем набросок из ряда наблюдений, которые обычно
рассматриваются при психологическом анализе принятия решений в усло­
виях неопределенности. Здесь будут обсуждаться два уровня ответов на нео­
пределенность. Сначала мы обсудим некоторые основные процессы ожида­
н ия и удивления в восприятии, которые могут быть рассмотрены к ак пред­
вестники субъективной вероятности. Затем мы обратимся к феномено­
логическому рассмотрению, в котором мы отличаем внутренние от внешних
атрибуций неопределенности и кратко опишем четыре модели суждения,
которые могут использовать люди, оценивая неопределенность.

Э лем ен тарн ы е ф орм ы вероятности


Неопределенность - это факт, с которым все формы ж изни должны быть
готовы бороться. Н а всех уровнях биологической сложности существует
неопределенность относительно значения знаков или стимулов и относитель­

*Эта глава впервые появилась в Cognition, 1982,11.143-157. Авторские права© 1981 при­
надлежат Elsevier Sequoia. Печатается в соответствии с разрешением.
Варианты неопределенности 583
но возможных последствий действий. На всех уровнях действие должно
предприниматься до того, как прояснена неопределенность, и должен быть
достигнут надлежащ ий баланс между высшим уровнем специфической го­
товности к событиям, которые произойдут с наибольшей вероятностью, и
общей способностью отвечать соответствующим образом, когда случается
непредвиденное. Поскольку фокус настоящей трактовки скорее находится
на убеждении, чем на действии, мы не будем обсуждать замечательные про­
цессы, когда низш ие организмы распределяют свое ответное усилие в соот­
ветствии с вероятностью подкрепления (H errnstein, 1970). Наш главный
интерес в этом разделе относится к неопределенности восприятия.

П ерцепт ивны е ожидания


Перед событием существуют ожидания. После него может быть удивление.
Удивление, главным образом, изучалось психофизиологическими метода­
ми, и было измерено разнообразными индикаторами ориентировочного от­
вета (Lynn, 1966; Sokolov 1969) и компонентом Р300 потенциалов, связан­
ным с событием (D uncan-Johnson & D onchin, 1977; Donchin, R itte r &
McCallum, 1978). Ожидания изучались во многих контекстах и широким
разнообразием методов.
Наше обсуждение перцептивных ожиданий будет организовано по схе­
ме, показанной на Рисунке 1, которая различает три основных типа ож ида­
ний. Первое основное различие отделяет активные от пассивных ожиданий:
активное ожидание занимает сознание и ограниченный объем внимания;
напротив, пассивное ожидание автоматично и не требует усилий, и лучше
описывается к а к диспозиция, чем к а к деятельность (Posner, 1978).

О жидания

(категории и (настройка)
предположения)

Рис. 1. Перцептивные ожидания


584 ПОСТКРИПТУМ
Некоторые ожидания относительно постоянны. Длительные ожидания
о ковариациях признаков определяют категории восприятия, которые мы
используем, чтобы организовать и закодировать опыт (Broadbent, 1971).
Специфические ож идания об объектах, например, что комнаты и окна, ве­
роятно, будут прямоугольными, функционируют, к ак постоянные предпо­
лож ения, которые помогают определять интерпретацию неясных стимулов
(Ittelson & K ilpatrick, 1951). Мы хронически лучше подготовлены к одним
событиям, чем к другим, как проиллюстрировало стойкое влияние прошлой
частоты на порог узнавания слов (Broadbent, 1967; M orton, 1969). В самом
деле, ож идания иногда дают галлюцинаторный опыт, который люди не мо­
гут отличить от действительного, к ак при эффекте фонематического восста­
новления. Так, вся сенсорная информация, соответствующая “s” в слове
“legislature”, может быть удалена из записи слова и заменена каш лем или
каким-либо другим естественным звуком. Испытуемые, которым представ­
ляю т эту запись, предельно убеждены, что они слыш ат иллюзорную фоне­
му (W arren, 1970).
Пассивные и временные ож идания опосредуют огромные эффекты кон­
текста при узнавании (Foss & Blank, 1980) и несколько вариантов эффекта
настройки (Posner, 1978). Например, включение буквы в предупреждаю­
щ ий сигнал, который представляет испытание, облегчает ответ на эту бук­
ву в ускоренной задаче на соответствие, даже когда случайности устроены
так, что предупреждающий сигнал не выражает никакой валидной инфор­
мации о цели. Познер (Posner, 1978) задокументировал некоторые важные
различия между пассивным ожиданием, установленным неинформативным
предупреждающим сигналом, и активным ожиданием, выработанным, ког­
да цель ф актически предсказуема, хотя и неполно, по этому сигналу. Пас­
сивное ожидание дает выгоду (например, более быстрый ответ), когда оно
подтверждается, но оно не препятствует ответу по целям, которые не были
настроены. Напротив, сигнал, который является причиной того, что испы­
туемый готовится к определенной цели, такж е снижает ответ по непредви­
денным целям. Н а язы ке теории вероятности, активное ожидание придер­
ж ивается правила комплементарности: высокая степень готовности к опре­
деленному событию достигается за счет недостаточной подготовки к дру­
гим событиям. Пассивная настройка связана с не-комплементарной моде­
лью выгод без потерь.
Пассивное ожидание и сознательное предвидение могут конфликтовать,
и есть свидетельства того, что пассивный процесс оказывает большее влия­
ние н а интерпретацию неясных стимулов. Эпштейн и Рок (Epstein и Rock,
1960) противопоставляли два типа ожиданий, используя рисунок, в кото­
ром левосторонний и правосторонний профили были объединены, чтобы
сформировать модель обратимой фигуро-фоновой организации. Наблюда­
тели составного рисунка видели только один из профилей, который обозна­
чал общий контур. Построив два профиля, которые можно было объединить
таким образом, Эпштейн и Рок представили профили отдельно, регулярно
Варианты неопределенности 585
чередуя в ряде проб, создав сознательное ожидание, что за одним всегда бу­
дет следовать другой. Затем в первый раз был представлен составной рису­
нок, и отмечалось, какое лицо видели в нем испытуемые. В соответствии с
эффектом настройки, наблюдатели почти всегда видели профиль, который
был показан в предыдущей пробе, а не тот, который они сознательно ожида­
ли увидеть.
Также сообщалось об аналогичной демонстрации конфликта между раз­
личными уровнями ожидания, в которых компонент Р300 электроэнцефа­
лограммы (ЭЭГ) был главной зависимой переменной. Р300 - это положитель­
ное отклонение в ЭЭГ, которое происходит где-то через 300 мсек после пред­
ставления любого стимула, который наблюдатель трактует как значитель­
ный или релевантный задаче. Многие подробные исследования демонстри­
руют тесную связь между предшествующей вероятностью событий и величи­
ной отклонений Р300, которую она вызывает (Donchin, R itter & McCallum,
1978). Когда испытуемому предъявляют серию Бернулли, часто повторяемые
события вызывают у него меньший Р300, чем редкие. Более того, ряд повто­
рений одного и того же события связан со стойким уменьшением Р300, пред­
полагая дальнейшее увеличение субъективной вероятности дальнейших по­
вторений. Наоборот, сознательное ожидание повторений последовательно
уменьшается во время долгого ряда, по хорошо известному заблуждению азар­
тного игрока. Очевидно, наблюдатель может быть подготовленным, или “на­
строенным” для одного события, сознательно ожидая другое - и может пока­
зать физиологическое свидетельство удивления на событие, которое было со­
знательно предсказано. Таким образом, есть ощущение, по которому инди­
вид в некотором смысле может иметь конфликтующие вероятности для од­
ного и того же события в одно и то же время. Эти наблюдения предполагают
образ ума, подобный бюрократии (Dennet, 1979), в котором различные части
имеют доступ к различным данным, придают им различное значение и при­
держиваются различных взглядов на ситуацию.

Восприят ие как пари


Ожидания, которые выработались в течение жизненного визуального опы­
та, имеют глубокое влияние на восприятие и поразительно недоступны со­
знательному знанию или намерению. Наиболее известные демонстрации
этих фактов были разработаны трансакционалистами, изучающими воспри­
ятие (Ittelson & K ilpatrick, 1951; K ilpatrick, 1961). Наблюдателей извест­
ной искаженной комнаты и вращающегося окна вынуждают приобретать
визуальный опыт, который противоречит к ак их общим знаниям, так и их
специфическому знакомству с объектами иллюзии. Так, друзья могут по­
казаться человеку великанами или крошечными существами, которые из­
меняют свой размер, продвигаясь вдоль стены искаженной комнаты, а бу­
м аж ная салфетка разрезать вращающееся окно. Эти поразительные эффек­
ты обеспечиваются за счет господствующего предположения, что комнаты
586 ПОСТКРИПТУМ
и окна прямоугольны. Хотя наблюдатель отлично знает, что это предположе­
ние неприменимо в данном случае, это знание не имеет никакого значитель­
ного эффекта на сознательное восприятие. Модели действительности, кото­
рые строились годами, не могут быть исправлены по требованию для частно­
го случая. Эти наблюдения снова подтверждают, что наблюдатель может од­
новременно иметь конфликтующие взгляды на одно и то ж е событие.
Мы отмечали, что перцептивные ожидания определяют то, что мы “ви­
дим” в неясных стимулах. В самом деле, трансакционалисты интерпрети­
ровали восприятие, к а к пари на реальность (Kilpatrick, 1961). Значитель­
ным аспектом таких перцептивных выборов является сильная привержен­
ность выбранной интерпретации. В нашем опыте не содержится никаких
показателей двусмысленности стимулов, и даже если перцептивные интер­
претации колеблются с течением времени, к а к с кубом Некера, они стре­
мятся быть достаточно определенными в любой конкретный момент. По­
давление неопределенности и двусмысленности в восприятии наводит на
мысль, что мы можем быть биологически запрограммированы, чтобы дей­
ствовать по наилучшему перцептивному пари, к ак если бы это пари не вклю­
чало бы никакого риска ошибки. Значительное различие между сознатель­
ным опытом восприятия и мыслью состоит в том, что последняя может пред­
ставлять сомнение и неопределенность, тогда к а к первое обычно нет.
Хотя подавление неопределенности отличает перцептивные пари от со­
знательного суждения о неопределенных событиях, обработка неопределен­
ности на этих двух уровнях может быть сходной в других отношениях. Два
поразительных наблюдения трансакционалистского исследования предла­
гают гипотезы, которые оказываются применимы к сознательным убежде­
ниям. Первая состоит в том, что перестроенный образ среды имеет тенден­
цию быть внутренним, отражая обычные влияния и зависимости среди при­
знаков обстановки и стимулов. Так, если объект представлен в условиях,
которые делают неясными к ак его размер, так и расстояние до него, выб­
ранная перцептивная интерпретация изберет размер и расстояние, которые
относятся к размеру на сетчатке глаза стандартным образом: если объект
воспринимается большим, тогда он такж е оказывается удаленнее, чем если
бы он казался маленьким (Ittelson & K ilpatrick, 1951).
Второе наблюдение состоит в том, перцептивная конструкция оказыва­
ется иерархическим процессом, в котором решения о глобальных призна­
ках обстановки принуждают и доминируют над решениями в отношении
объектов, содержащихся в ней. И скаж енная комната обеспечивает наилуч­
ш ий пример. То, что мы видим - это не компромисс между двумя крайними
взглядами: люди нормального роста в искаженной комнате или люди нео­
бычного роста в нормальной комнате. Последний взгляд просто преоблада­
ет над первым, к а к если бы форма комнаты была вычислена перед тем, как
началась обработка людей в ней. Можно ли будет показать, что сходные
правила действуют, например, в построении сценариев будущих событий -
это проблема, которая заслуживает изучения.
Варианты неопределенности 587
Ф е н о м е н о л о ги я н ео п р ед ел ен н о сти
Предыдущий раздел пытался показать, что правила, управляющие перцеп­
тивными ожиданиями, отличаются от правил теории вероятности. Настоя­
щ ий раздел расширяет этот анализ до опыта сомнений и неопределенности,
который, предположительно, отражают суждения субъективной вероятнос­
ти. Как мы увидим, понятие вероятности относится в естественном язы ке к
нескольким различным состояниям сознания, к которым правила стандарт­
ного исчисления вероятности не могут быть применимы в равной степени.
Чтобы оценить сложность ожиданий, рассмотрим одно из их проявле­
ний: удивление, которое мы переживаем, когда ожидание наруш ается.
Представьте, что монету нужно подбросить 40 раз. Какое количество “ре­
ш ек” вы ожидаете? Если вы предположите, что монета без дефектов, вы,
вероятно, заявите, что результат 20-20 более вероятен, чем какой либо дру­
гой, и все же вы будете более удивлены этим исходом, чем результатом 22
“реш ек” и 18 “орлов”. Показана ли “истинная” субъективная вероятность
этих двух событий рассмотренным суждением об их относительной вероят­
ности или невольной реакцией удивления, которую они вызовут?
Одной возможной интерпретацией является то, что пример иллюстрирует
конфликт между двумя подходами к суждению о вероятности: суждение о
том, что наиболее вероятный результат 20-20, происходит от знания гтра вил
шансов, но такие исходы, как 22-18 или 17-23, более вероятно, находятг т на
другом уровне, где вероятность определяется репрезентативностью. Не.лно-
го неравный исход представляет как правильность монеты, так и случайность
подбрасывания, которое вовсе не представлено равным результатом. С этой
позиции, большая психологическая реальность ожиданий, основанная на
репрезентативности, проявляет себя в реакции удивления.
Возможна несколько иная интерпретация, которая фокусируется на ко­
дировании возможных исходов. Как мы увидим, часто в разговоре являет­
ся подходящим расширить определение X до “X или что-то вроде этого”.
Если самопроизвольное кодирование событий следует подобным правилам,
результаты, подобные 22-18 или 17-23, будут самопроизвольно закодирова­
ны к а к “почти равное разделение”, тогда к ак результату 20-20 присвоят от­
личительный код “точно равное разделение”. Человек, который пытается
судить об относительной вероятности событий, рассмотрит точные утверж­
дения о результатах и отметит, что 20-20 более вероятно, чем, скажем, 22-
18. Но реакция удивления может быть определена естественным кодирова­
нием событий. Событие 22-18 будет тогда относительно неудивительным,
потому что оно закодировано к а к приблизительно равный результат, кото­
рый, в самом деле, более вероятен, чем точно равный результат.
Роль кодирования событий очевидна в интерпретации неопределенных
утверждений, таких к ак “Я оцениваю, что...” или иногда “Я думаю, что...”.
Неопределенные утверждения являю тся классом речевых актов, который
характеризуется специфическими условиями искренности и проверками
588 РЕПРЕЗЕНТАТИВНОСТЬ
валидности. Рассмотрим, например, прогноз: “Я думаю, что цена на золото
будет выше на 50% через б месяцев, чем сейчас”. Взятое буквально, это то­
чечное прогнозирование, которому следует присвоить очень маленькую ве­
роятность подтверждения. Но прогнозирование не предназначено для того,
чтобы его понимали буквально. Точечные прогнозы обычно понимаются как
сравнительные утверждения или утверждения об области распространения,
в которую, к а к ожидается, попадет результат, например, “Я думаю, что по­
вышение цены на золото будет ближе к 50% , чем к Х% или Y% ”. Говоря­
щ ий и слушающий обычно ожидают согласия по мысленно подразумевае­
мым значениям X и Y. Например, прогнозирующий, цитируемый выше,
будет считаться замечательно точным, если цена на золото в действитель­
ности поднимется на 53 % за следующие 6 месяцев, хотя прогноз не был стро­
го точным. Таким образом, говорящий, который отстаивает численное про­
гнозирование, скорее придерживается области распространения, чем кон­
кретной точки в этой области. Говорящий такж е придерживается предпо­
ложения, что значение в равной степени вероятно быть как выше оценки,
так и ниже ее, исклю чая случаи, когда характер прогноза делает это невоз­
можным. Так, человек, который говорит “Я думаю, что цена на золото под­
нимется на 50% за следующие б месяцев”, будет считаться намеренно вво­
дящ им в заблуждение, если он такж е думал, но не говорил, что действи­
тельное значение было бы более вероятно выше этой оценки, чем ниж е ее.
Значительно то, что условия искренности, связанные с прогнозированием,
не требуют, чтобы предсказываемые значения (или область распространения)
считались высоко вероятными, но лишь чтобы они считались более вероятны­
ми, чем сравнительные значения (или область распространения). Например,
мужчина, который утверждает “Я думаю, что Билли Джон выиграет золотую
медаль по прыжкам в высоту на следующих Олимпийских Играх”, не будет
считаться лгуном, если он предпочтет поставить против этого предположения,
чем на него, но ему запрещено добавлять “а шансы Джека Смолла даже еще
выше”. Таким образом, естественный язы к позволяет играть привилегирован­
ную роль наилучшей догадке, а идентификация благоприятной догадки выра­
жает информацию об альтернативах, с которыми она может справедливо срав­
ниваться. Упоминание любимого атлета показывает, что он должен сравни­
ваться с другими атлетами, а не с дизъюнкцией возможных победителей. Од­
ним последствием этого правила является то, что иногда можно “предсказать”
событие, которое рассматривается как менее вероятное, чем его дополнение,
если дополнение естественно закодировано как дизъюнкция.
Сходное ограничение относится к выражениям уверенности. Утверждение
уверенности выражает неопределенность человека в прогнозировании, оценке
или выводе, которые он уже сделал. Так, будет естественным спросить “На­
сколько вы уверены в том, что вы правы?”, нобудет аномальным спросить “На­
сколько вы уверены в том, что вы ошибаетесь?”. Уверенность - это субъектив­
ная вероятность или степень убеждения, связанная с тем, что, как мы “дума­
ем”, случится.
О психологии прогнозирования 589
Обычный язы к также обеспечивает огромное количество выражений, что­
бы говорить о событиях, которые могут произойти, хотя нам не обязательно
“думать”, что они произойдут. Так, люди оценивают шансы кандидатов, риск
различных видов деятельности, дают шансовые результаты футбольных мат­
чей и понимают утверждения синоптиков о вероятности дождя. Теперь мы
обратимся к более подробному анализу состояний неопределенности, кото­
рые могут выражать подобные утверждения, следуя схеме, показанной на
Рисунке 2. Два уровня рисунка, атрибуции неопределенности и варианты нео­
пределенности, обсуждаются в следующих разделах.

А т рибуция неопределен нос гаи


Первостепенное различие, показанное на рис. 2, относится к двум локусам,
к которым, может быть приписана неопределенность: внешний мир или наше
состояние знания. Например, мы приписываем причинным системам в ре­
альном мире неопределенность, связанную с подбрасыванием монеты, вы ­
тягиванием карт из колоды, результатами футбольного матча и поведением
вулкана Св. Хеленса. Эти причинные системы имеют диспозиции произво­
дить различные события, а мы судим о вероятности этих событий, оцени­
вая относительную силу конкурирующих диспозиций. Наоборот, такие ут­
верждения, как “Я ду маю, что Монблан - это самая высокая гора в Европе”
или “Я надеюсь, что написал ее имя правильно”, отражают неопределен­
ность, которая приписывается скорее уму человека, а не горе и л а жен щи­
не. (Howell и B urnett, 1978, применили термины внутренняя неопределен­
ность и внешняя неопределенность, соответственно, к событиям, которые
субъект может и не может контролировать.)
Haine различие между незнанием и внешней неопределенностью тесно
связано с более общим различием между внешними и внутренними атрибу­
циями опыта. Цвет, размер и текстура, например, обычно ощущаются как
свойства, которые принадлежат внешним объектам, но боль, чувства и вос­
поминания приписываются скорее чувствующему субъекту, чем проявля­
ющемуся объекту.
Относительно атрибуции неопределенности можно иногда сдела ть вывод,
исходя из простого лингвистического теста: подходящей ли при описании
оценки неопределенности будет фраза “вероятность составляет...”? Или
нужно сказать “моя вероятность составляет,..”? В противоположность по­
зиции Байеса, который трактует все вероятности как субъективные и лич­
ные, естественный язы к отмечает различие между внешней и внутренней
неопределенностью. Так, будет законным говорить о “лучшей оценке веро­
ятности смены режима в Саудовской Аравии в следующем году”, но будет
ненормальным говорить, что “наилучшей оценкой вероятности того, что Нил -
это самая длинная река в мире, будет...”. Наилучшие оценки вероятности
принадлежат общественной сфере. Выражения о частном неведении - нет.
590 ПОСТКРИПТУМ
Этот тест не всегда отличает внутреннюю неопределенность от внешней.
Например, можно говорить о вероятности того, что Марлоу написал “Гам­
лета”, хотя эта вероятность приписывается, скорее, нашему неведению, чем
силе склонности Марлоу к написанию пьес. Использование “термина веро­
ятность” в этом примере оправдывается существованием общественной ча­
сти знания, которая уменьшает, но не ликвидирует неопределенность отно­
сительно авторства “Гамлета”. Не всем нужно иметь доступ к этому знанию,
но оцениваемая вероятность относится к разумному или согласованному вы­
воду на основе имеющихся свидетельств. Однако, в примере с Нилом обще­
ственный массив свидетельств, конечно ж е, включает правильный ответ, и
неведение может быть только частным.
Атрибуция неопределенности события к диспозиции или к неведению
зависит, помимо всего прочего, от времени. Неопределенность прошлых
событий, вероятно, будет ощущаться к а к неведение, особенно если истина
известна кому-либо еще, тогда к ак неопределенность будущего, более есте­
ственно, приписывается диспозициям релевантной системы. В самом деле,
отмечалось, что люди демонстрирую различные отношения к результату
подбрасывания монет, в зависимости от того, подброшена уж е монета или
еще нет (R othbart & Snyder, 1970).

Неопределенность

Атрибуция: Внешняя Внутренняя

Форма: Распределительная Единичная Прямая На основе рассуждений


(внешняя точка (внутренняя (опыт) (аргументы)
зрения) точка зрения)

Рис. 2. Варианты неопределенности

В ариант ы неопределенности
Второй уровень на Рисунке 2 различает четыре прототипных варианта неопре­
деленности, идентифицированной характером данных, которые может рассмат­
ривать человек, выносящий суждение, оценивая вероятность. Внешняя нео­
пределенность может быть оценена двумя способами: (i) согласно распредели­
тельной форме, когда рассматриваемый случай принимается как пример класса
подобных случаев, для которых относительная частота известна или можетбыть
оценена; (ii) согласно единичной форме, когда вероятности оцениваются из на­
личных особенностей частного рассматриваемого случая. Эти две формы суж­
дения иллюстрируются следующей правдивой историей.
О психологии прогнозирования 591
Группа, имевш ая дело с разработкой учебного плана высшей ш колы по
мышлению в условиях неопределенности, проводила заседание по плани­
рованию. Бы л поднят вопрос о времени, которое потребуется, чтобы завер­
ш ить первый вариант учебника. Участников обсуждения попросили оце­
нить это значение как можно более реалистично; семь оценок ранжирова­
лись от 18 месяцев до 3 лет. Тогда руководитель группы обратился к одному
из участников, работнику сферы образования со значительным опытом в
проблемах разработки учебных планов со следующим вопросом: “Каков был
опыт других групп, которые пытались написать учебник и разработать учеб­
ный план в новой области, где не существовало никаких предшествующих
учебных курсов? Сколько им потребовалось времени, чтобы закончить учеб­
ник, начиная с той стадии, в которой находится наш проект?” Приводящий
в уныние смысл ответа оказался даже более неожиданным для эксперта,
который его давал, чем для остальных участников: “Большинство групп, о
которых я могу вспомнить, потерпели неудачу и так и не закончили учеб­
ник. У тех, кто преуспел в этом деле, время завершения составляет от 5 до 9
лет, со средним значением 7 лет”.
Последующая обнаружила обнаружило, что все участники произвели
свои первоначальные оценки согласно единичной форме, строя планы и сце­
нарии с некоторым допуском безопасных резервов для непредвиденных слу­
чайностей. Из-за эффектов привязки (Kahneman & Tversky, 1974,1) оцен­
ка, полученная при добавлении безопасных резервов к текущим планам,
наиболее вероятно, будет в высокой степени оптимистичной. Примечатель­
ным аспектом этого эпизода было то, что релевантные данные распределе­
ния не были использованы самопроизвольно, хотя они были в наличии у
одного из экспертов в личном знании, и могли быть оценены достаточно точ­
но несколькими другими участниками.
Наш пример иллюстрирует применение распределительной и единичной
формы рассуждений в прогнозировании непрерывной переменной: време­
ни, требуемого на завершение проекта. Данные распределения, в этом слу­
чае, состояли из знания об относительной частоте различных сроков завер­
ш ения. Конечно ж е, подобное рассуждение можно применить, чтобы оце­
нить вероятность дискретного результата, такого к ак провал проекта. От­
носительная частота такого результата в релевантном классе обеспечивает
основу для распределительной оценки вероятности, а другая информация о
частном случае, использованная в единичной форме, может нести отпеча­
ток склонности к провалу или к успеху. Существует много примеров, в ко­
торых к одному и тому же вопросу можно подойти к ак с позиции единич­
ной, так и распределительной формы.
Сравните следующие примеры:
1. “Есть шанс, что ты застанешь Джона дома, если позвонишь завтра утром. Он го­
ворил, что предпочитает работать дома”.
2. “Есть шанс, что ты застанешь Джона дома, если позвонишь завтра утром. Он ча­
сто был дома, когда я звонил ему”.
592 РЕПРЕЗЕНТАТИВНОСТЬ
Утверждение 1 допускает только единичное суждение о вероятности, что
Джон будет дома. Утверждение 2 могло бы поддержать как распределитель­
ную, так и единичную оценки. Относительная частота сходных событий, когда
Джон был утром дома, обеспечивает естественную оценку вероятности, что
он будет там завтра, но это выражение также наделило Джона склонностью
проводить утро дома, в большей степени, чем это сделало Утверждение 1.
Мы предположили (Kahneman & Tversky, 1979а, 30), что люди обычно
предпочитают единичную форму, согласно которой они принимают “внут­
реннюю точку зрения” причинной системы, который немедленно выдает ис­
ход, в большей степени “внешнюю точку зрения”, которая связывает рассмат­
риваемый случай со схемой осуществления выборки. Наш пример планиро­
вания иллюстрирует это предпочтение единичной модели. Он также иллюст­
рирует еще один эффект, который, как мы подозреваем, достаточно общий:
распределительная форма суждения с большей вероятностью, чем единич­
ная, выдает точные оценки значений и разумную оценку вероятности.
Теперь мы обратимся к различию между формами оценки внутренней
неопределенности, которые иллюстрируют следующие примеры:
3. “Я полагаю, что Нью-Йорк севернее Рима, но я не уверен”.
4. “Я думаю, ее зовут Дорис, но я не уверен”.

Неопределенность, выраженная этими утверждениями, полностью внут­


ренняя: утверждения отражают (частичное) неведение, а не диспозицию
внеш них объектов. Несомненно, говорить о некоторой возможности Нью-
Й орка быть расположенным севернее Рима (между прочим, это не так), или
о некоторой возможности Линды запоминаться к ак Дорис, несколько неес­
тественно.
Эти два утверждения различаются по характеру свидетельства, на кото­
ром они основаны. Утверждение 3 могло бы отразить процесс тщательной
проверки и взвеш ивания свидетельств и доводов (например, Нью-Йорк на­
много холоднее, чем Рим, Рим находится в центре Италии и т.д.). Утверж­
дение 4 имеет иной характер. Выраженная уверенность основана на инт­
роспективном суждении о силе ассоциации. Как это часто случается, когда
мы проверяем орфографию по тому, “правильно ли вы глядит” слово, уве­
ренность опирается на непроанализированный опыт. В исследованиях пси­
хофизики и пам яти уверенность, связанная с суждениями, значительно
коррелирует с точностью: люди с большей вероятностью уверены, когда они
правы, чем когда неправы, хотя их оценки о собственной правоте плохо к а ­
либрованы (см. Главу 22).
К ак и в случае внешней неопределенности, внутренняя неопределенность,
связанная с определенным вопросом, иногда может быть оценена к ак аргу­
ментированной формой, так и интроспективной формой. Например, к воп­
росу относительно возраста кинозвезды можно подойти интроспективно,
пы таясь найти ответ, который звучит похоже, или согласно аргументиро­
ванной форме, пытаясь извлечь ответ из других знаний.
Варианты неопределенности 593
Мы не хотели бы предположить, что любой опыт неопределенности мож ­
но отнести к одному из четырех вариантов Рисунка 2. Несомненно, суще­
ствует много смешанных и неопределенных случаев. Мы видели, что нео­
пределенность в данной проблеме может быть приписана внешним диспо­
зициям, неведению человека или комбинации того и другого, и что она мо­
жет быть оценена согласно единичной форме, распределительной форме или
смеси этих форм. Целью нашего трактования было выдвинуть на первый
план некоторые значительные измерения в разнообразии опыта неопреде­
ленности, а не предложить исчерпывающую взаимоисключающую класси­
фикацию этого опыта. Попытка классификации экспериментальных опе­
раций в измерении субъективной вероятности описана у Хоуэлл и Бернетт
(Howell и B urnett, 1978).

Обсуждение
Хотя язы к вероятности может быть использован для выражения любой фор­
мы неопределенности, законы теории вероятности не применяются ко всем
вариантам неопределенности с одинаковой силой. Наиболее вероятно, эти
законы принимаются и удовлетворяются в интуитивных суждениях, когда
внеш няя неопределенность оценивается согласно распределительной, или
частотной, форме. Например, комплементарность субъективной вероятнос­
ти является очень непреодолимой тогда, когда мы обращаемся к статисти­
ческим данным о погоде, чтобы оценить вероятность того, что будет дождь 12
апреля следующего года: релевантный набор прошлых апрельских дней впол­
не можно разделить на дождливые дни и дни, когда дождя не было.
Комплементарность менее непреодолима в других вариантах. Когда нео­
пределенность оценивается в терминах склонности возможности, доводов
или уверенности, менее очевидно, что вероятность следует увеличивать до
единицы, - даже если определенно известно, что одна из альтернатив пра­
вильна. Например, можно подвергнуть сомнению, почему степень убежден­
ности в утверждении, что Нью-Йорк севернее Рима, и степень убежденнос­
ти в утверждении, что Нью-Йорк южнее Рима, должны в сумме давать то
ж е значение, что и степени убежденности для любой другой пары компле­
м ентарны х утверждений. В самом деле, некоторые авторы (например,
Cohen, 1977; Shafer, 1976) предполагали, что комплементарность не следу­
ет применять к степеням убежденности. В частности, Шафер оспаривал ком­
плементарность убежденности на том основании, что существуют ситуации,
в которых две взаимоисключающие и исчерпывающие гипотезы обе имеют
существенную поддержку, и другие ситуации, в которых ни одна из гипо­
тез не имеет особой поддержки. Сходные вопросы могут быть подняты в от­
ношении необходимости комплементарности в ощущении уверенности и в
оценке конфликтных склонностей.
Варианты неопределенности могут различаться по уверенности, с кото­
рой они оцениваются. Представьте, что канцелярская кнопка была подбро­
ш ена четыре раза и упала дважды на кончик и дважды на головку. Имея
эти данные, наблюдатели определят вероятность 0.5 событию, что кнопка
упадет на головку при следующем подбрасывании. Они такж е определят
вероятность 0.5 событию, что подброшенная монета покажет “реш ку”, но
они выражаю т гораздо большую уверенность в своем суждении о монете,
чем о кнопке. К ак иллюстрирует этот пример, вполне возможно определить
различную степень уверенности одному и тому ж е суждению о возможнос­
ти. Уверенность в отношении вероятностей важ на, поскольку она контро­
лирует решения. Есть свидетельства (Ellsberg, 1961; R aiffa, 1961), что .люди
предпочитают ставить на события, которые имеют известные вероятности,
такие к а к подбрасывание монеты, а не события, которые связаны с комби­
нацией внешней неопределенности и неведения, такие к ак подбрасывание
канцелярской кнопки.
Существуют естественные связи между концепциями вероятности, выд­
винутыми различными ш колами, изучающими эту тему, и формами нео­
пределенности, которые мы обсудили. Так, частотная, или объективная,
интерпретация вероятности ограничивает концепцию до внешней неопре­
деленности, генерируемой процессом осуществления выборки. Наоборот,
ш кола Байеса, или личностная ш кола, трактует всю неопределенность к ак
незнание. Согласно ш коле Байеса, предпочтения являю тся основой убеж­
дений, а вероятности являю тся производными от предпочтений между пари.
Однако с психологической точки зрения эта эвристика пари каж ется нереа­
листичной . Обсуждения в этой области всегда были острыми из- за существо­
вания различны х видов интуиции, которые являю тся индивидуально вы з­
ванными и взаимно несовместимыми, и из-за того, что нет согласия по к р и ­
терию для разреш ения нормативных споров, когда эти виды интуиции кон­
фликтуют. Психологический анализ, возможно, мог бы внести вклад в нор­
мативное обсуждение, обеспечив адекватное описание видов интуиции, из
которых черпают свою привлекательность различные позиции.
Литература

Abelson, R .P. Modes of resolution of belief dilemmas. Jo u rn al of Conflict


Resolution, 1959,3,343-352. (8)
Abelson, R .P ., Aronson, E., McGuire, W .J., Newcomb, T.M., Rosenberg,
M .J., & T annenbaum , P .H . (Eds.). Theories of cognitive consistency: A
sourcebook. Chicago: Rand-McNally, 1968. (15)
Adams, J , K. A confidence scale defined in term s of expected percentages.
A m erican Journal of Psychology, 1957, 70, 432-436. (20, 22)
Adams, J .K ., & Adams, P. A. Realism of confidence judgments. Psychological
Review, 1961,68,33-45. (22,31)
Adams, P.A ., & Adams, J.K . Training in confidence judgm ents. A m erican
Jo u rn al of Psychology, 1958, 71, 747-751. (22, 31)
A dler, A. Individual psychology. In C. M urchinson (Ed.), Psychologies of
1930. W orcester, Mass.: Clark U niversity Press, 1930. (16)
A dorno, T ., F ren k el-B ru n sw ik , E ., L evinson, D., & S an fo rd , N. The
a u th o rita ria n personality, New York: H arper, 1950. (15)
Aj zen, I. Intuitive theories of events and the effects of base-rate information on
prediction, Journal of Personality and Social Psychology, 1977,35,303-314. (10)
A lberoni, F. C ontribution to the study of subjective probability, P a rt I.
Jo u rn al of General Psychology, 1962, 66, 241-264. (3)
A lexander, S.A.H. Sex, argum ents, and social engagements in m arital and
p rem arital relations. U npublished m a ster’s thesis. U niversity of M issouri,
K ansas City, 1971. (28)
A lk e r, H .A . Is p e rso n a lity s itu a tio n a lly specific o r in tra p sy c h ic a lly
consistent? Journal of Personality, 1972,40,1-16. (15)
Allen, J.G . B reast surgery, principles and practice. In C.A. Moyer (Ed.),
Surgery: Principles and Practice. Philadelphia: Lippincott, 1965. (18)
A llport, G.W. The n atu re of prejudice. Reading, Mass.: Addison-Wesley,
1954.(15)
596 ЛИТЕРАТУРА
A llport, G.W . Traits revisited. Am erican Psychologist, 1966, 21,1-10. (15)
A lpert, W ., & R aiffa, H .A progress report on the training of probability
assessors. U npublished m anuscript, 1969. (1, 22, 33)
Anderson, C.A., Lepper, M .R., &Ross, L. The perseverance of social theories:
The role of explanation in the persistence of discredited inform ation. Jo u rn al
of Personality and Social Psychology, 1980, 39,1037-1049. (9,15)
A nderson, N.H . Inform ation integration theory: A brief survey. In D.H.
K ra n tz , R.C. A tk in so n , R.D. Luce, and P. Suppes (Eds.), C ontem porary
Developments in M athem atical Psychology (Vol. 2). San Francisco: Freeman,
1974. (27)
A rkes, H .R ., W ortm ann, R.C., Saville, P.D ., & H arkness, A.R. H indsight
bias among physicians weighing the likelihood of diagnoses. Jo u rn al of Applied
Psychology, 1981, 66, 252-254. (31)
A rm eliu s, K. Task p re d ic tab ility and perform ance as d e term in a n ts of
confidence in multiple-cue judgm ents. Scandinavian Jo u rn al of Psychology,
1 9 7 9 ,2 0 ,1 9 -2 5 .(3 1 )
Ashm ore, R .D ., & Collins, B.E. Studies in forced compliance X: A ttitu d e
change and com m itm ent to m aintain publicly a counter-attitudinal position.
Psychological R eports, 1968, 22,1229-1234. (9)
Bach, R. N othing by chance. The American W ay, 1973, 6, 32-38. (33)
Bacon, F. The new organon and related w ritings. New York: Liberal A rts
P ress, 1960. (Originally published in 1620.) (9)
Barclay, S., & Peterson, C.R. Two methodsfor assessing probability distributions
(Tech. Rep. 73-1). McLean, Va.: Decisions and Designs, Inc., 1973. (22)
B a r-H ille l, M. On th e s u b je c tiv e p ro b a b ility of co m p o u n d e v e n ts .
Organizational Behavior and Human Performance, 1973,9,396-406. (1 ,2 3 ,3 0 )
B ar-H illel, M. S im ilarity and probability. O rganizational B ehavior and
H um an Perform ance, 1974, H, 277-282. (5)
Bar-Hillel, M. The role of sample size in sample evaluation. O rganizational
Behavior and H um an Perform ance, 1979,24,245-257. (5, 34)
B ar-H ille l, M. The b a se -ra te fa lla cy in p ro b a b ility ju d g m e n ts. A cta
Psychologies, 1980,44, 211-233. (10, 34) (a)
Bar-Hillel, M. W h at features make samples seem representative? Jo u rn al of
Experim ental Psychology: H um an Perception and Perform ance, 1980, 6, 578-
589. (5, 6)(b)
Bar-Hillel, M ., & Falk, R. Some teasers concerning conditional probabilities.
U npublished m anuscript, 1980. (34)
Bar-Hillel, M ., & Fischhoff, В. W hen do base rates affect predictions? Journal
of Personality and Social Psychology, 1981,41, 671-680. (10)
B arraclough, G. M andarins and Nazis. New York Review of Books, 1972,
19, 37-42. (23)
Bartlett, F.C. Remembering. Cambridge: Cambridge University Press, 1932. (12)
Beaver, W .H . Financial ratios as predictors of failure. In Em pirical research
Литература 597
in accounting: Selected studies. Chicago: University of Chicago, Graduate School
of Business, In stitu te of Professional Accounting, 1966. (28)
Becker, B.W ., &Greenberg, M.G. Probability estim ates by respondents: Does
w eighting improve accuracy? Jo u rn al of M arketing Research, 1978, 15, 482-
486. (31)
Becker, C. Everyman his own historian. A merican H istorical Review, 1935,
40, 221-236. (23)
Beckman, L. Effects of students’ performance on teachers’ and observers’
attributions of causality. Journal of Educational Psychology, 1970,61,75-82. (9)
Bern, D .J. Self-perception: A n a lte rn a tiv e in te rp re ta tio n of cognitive
dissonance phenomena. Psychological Review, 1967, 74,183-200. (7,32)
Bern, D .J., & Allen, A. On predicting some of the people some of the time:
The search for cross-situational consistencies in behavior. Psychological Review,
1974, 51,506-520.(15)
Bern, D. J ., & Funder, D.C. Predicting more of the people more of the time:
Assessing the personality of situations. Psychological Review, 1978, 85, 485-
501.(15)
Bern, D .J., & Lord, C-G. Template m atching: A proposal for probing the
ecological validity of experim ental settings in social psychology. Jo u rn al of
Personality and Social Psychology, 1979, 37,833-846. (15)
Bern, D .J., & McConnell, H.K. Testing the self-perception explanation of
dissonance phenomena: On the salience of prem anipulation attitudes. Jo u rn al
of Personality and Social Psychology, 1970,14, 23-31. (32)
B enson, L. T ow ard th e s c ie n tific s tu d y o f h is to ry : S elected essays.
Philadelphia; Lippincott, 1972. (23)
Bentham, J . Handbook of political fallacies. Baltimore: Johns Hopkins Press,
1952. (Originally published in 1824.) (32)
Ben Zvi, A. H indsight and foresight: A conceptual framework for the analysis
of surprise attacks. W orld Politics, 1976, 28,381-395. (23)
Beyth, R. Man as an intuitive statistician: On erroneous intuitions concerning
the description and prediction of events. U npublished m aster’s thesis. The
Hebrew U niversity, Jerusalem , 1972. (In Hebrew) (4)
Beyth-Marom, R ., & Dekel, S. Thinking under uncertainly: A textbook for
junior high school students. In press. (In Hebrew) (31, 33)
B ierbrauer, G. Effect of set, perspective, and temporal factors in attribution.
U npublished doctoral dissertation, Stanford U niversity, 1973. (9)
Block, M.A., & Reynolds, W. How vital is mammography in the diagnosis
and m anagem ent of breast carcinoma? Archives of Surgery, 1974, 108, 588-
591.(18)
Borgida, E, Scientific deduction-Evidence is not necessarily inform ative: A
reply to W ells and Harvey. Journal of Personality andSocial Psychology, 1978,
36, 477-482. (10)
Borgida, E ., & Brekke, N. The base-rate fallacy in attribution and prediction.
598 ЛИТЕРАТУРА
In J.H . Harvey, W .J. Ickes, andR .F. K idd(Eds.), New Directions in A ttribution
R esearch (Vol. 3). Hillsdale, N .J.: Erlbaum , 1981. (10)
Borgida, E., & Nisbett, R. Thedifferentialimpactof abstract vs. concrete informa­
tion on decisions. Journal of Applied Social Psychology, 1977,7,258-271. (7)
Bousfield, W .A ., & Sedgewick, C.H. An analysis of sequences of restricted
associative responses. Journal of General Psychology, 1944, 30,149-165. (11)
Bowman, E. H. Consistency and optim ality in m anagerial decision m aking.
M anagem ent Science, 1963,9,310-321. (28)
Bradley, G. W . Self-serving biases in the attribution process: A reexamination
of the fact or fiction question. Jo u rn al of Personality and Social Psychology,
1978, 36,5 6 -7 1 .(9 )
Braine, M.D.S. On the relation between th e n atu ral logic of reasoning and
standard logic. Psychological Review, 19 78,85,1-21. (34)
B ransford, J.D ., & Franks, J . J . The abstraction of linguistic ideas. Cognitive
Psychology, 1971,2, 331-350. (6)
B rier, G .W . V erification of forecasts expressed in term s of probability.
M onthly W eather Review, 1950, 75,1-3. (22)
Broadbent, D.E. W ord-frequency effect and response bias. Psychological
Review, 1967,74,1-15. (35)
Broadbent, D.E. Decision and Stress. London: Academic Press, 1971. (35)
Brown, E.A .R . The tyranny of a construct: Feudalism and h isto rian s of
medieval Europe. A m erican H istorical Review, 1974,79,1063-1088. (23)
Brown, T.A. A n experim ent in probabilistic forecasting (R eport R-944-
ARPA). Santa Monica: The RAND Corp., 1973. (22)
Brown, T.A ., & S huford, E.H. Q uantifying u n certain ty in to num erical
probabilities fo r the reporting of intelligence (Report R-1185-ARPA). Santa
Monica: The RAND Corp., 1973. (22)
B rücker, H. Comm unication is power: U nchanging values in a changing
journalism . New York: Oxford U niversity Press, 1973. (33)
B runer, J.S . Going beyond the inform ation given. In H. G ruber, et at. (Eds.),
Contem porary approaches to cognition. Cambridge, Mass.: H arvard U niversity
P ress, 1957. (15) (a)
B runer, J.S . On perceptual readiness. Psychological Review, 1957,64,123-
152. (15) (b)
B runer, J.S . The act of discovery. H arvard Educational Review, 1961, 31,
21-32.(12)
B runer, J .S ., Postm an, L ., & Rodrigues, J . Expectations and the perception
of color. A m erican Jo u rn al of Psychology, 1951, 64, 216-227. (15)
B runer, J.S ., & Potter, M.C. Interference in visual recognition. Science, 1964,
144, 424-425. (11)
B runsw ik, E. O rganism ic achievem ent and en v ironm ental probability.
Psychologi-cal Review, 1943, 50, 255-272. (19)
Bryan, W . B. Testimony before the Subcommittee on State Energy Policy,
Литература 599
Committee on Planning, Land Use, and Energy, California State Assembly,
February 1,1974. (33)
B urton, L, K ates, R .W ., & W hite, G.F. The environm ent as hazard. New
York: Oxford U niversity Press, 1978. (33)
Byrne, R. R. Correlation of therm ography, xeromammography and biopsy
in a com m unity hospital. W isconsin Medical Jo u rn al, 1974, 73, 35-37. (18)
Cam bridge, R .M ., & Shreckengost, R. C. A re you sure? The subjective
probability assessment test. Unpublished m anuscript. Langley, Va.: Office of
Training, Central Intelligence Agency, 1978. (22)
Campbell, D.T. Blind variation and selective retention in creative thought as
in other knowledge processes. Psychological Review, I960, 67,380-400. (19)
Campbell, D.T. Reforms as experim ents. American Psychologist, 1969, 24,
409-429. (4)
Campbell, D. T. “Degrees of freedom ” and th e case study. Com parative
Political Studies, 1975,8,178-193. (23)
Carlsson, G. Random walk effects in behavioral data. Behavioral Science,
1972,17,430-437.(23)
C arr, E.H. WHiat is history? London: Macmillan, 1961. (23)
C arver, R .P.A critical review of m athagenic behaviors and the effect of
questions upon the retention of prose m aterials. Jo u rn al of Reading Behavior,
1972,4,93-119. (12)
Cass, J ., & Birnbaum, M. Com parath э guide to American colleges. New York:
H arper & Row, 1968. (28)
Casscells, W ., Schoenberger, A., & Grayboys, T. Interpretation by physicians
of clinical laboratory results. New England Jo u rn al of Medicine, 1978,299,999-
1000. (10,18)
C astellan, N .J .,J r . Decision m aking w ith m ultiple probabilistic cues. In
N. J . Castellan, D.P. Pisoni, &G.R. P otts (Eds.), Cognitive Theory, 2. Hillsdale,
N .J.: Erlbaum , 1977. (19)
Cavanaugh, J.C ., & Borkowski, J,G . Searching for meta-memory-memory
connections. Developmental Psychology, 1980,16, 441-453. (31)
Chan, S. The intelligence of stupidity: U nderstanding failures in strategic
w arn-ing. Am erican Political Science Review, 1979, 73,171-180. (23)
Chapman, L. J . Illusory correlation in observational report. Jo u rn al of Verbal
Learning and Verbal Behavior, 1967,6,151-155. (15)
C hapm an, L .J ., & C hapm an, J .P . G enesis of p o p u la r b u t e rro n e o u s
psychodiagnostic observations. Journal of Abnormal Psychology, 1967,73,193-
204. (15)
Chapman, L .J., & Chapman, J .P . Illusory correlation as an obstacle to the
use of valid psychodiagnostic signs. Jou rn al of Abnormal Psychology, 1969,
74, 271-280. (1 ,1 5 ,1 7 )
Choo, G.T.G, T raining and generalization in assessing probabilities fo r
d iscrete events (Tech. Rep. 76-5). U xbridge, England: B runei In stitu te of
O rganizational and Social Studies, 1976. (22)
600 ЛИТЕРАТУРА
C h riste n se n -S z a lan sk i, & B ushyhead, J .B . P h y sic ia n s’ use of
probabilistic inform ation in a real clinical setting. Jo u rn al of Experim ental
Psychology: H um an Perception and Perform ance, 1981,7,928-935. (22, 31)
Clark, H. H ., & Clark, E. V. Psychology and Language. New York: H arcourt
Brace Jovanovich, 1977. (34)
C lark, R .L., Copeland, M .M ., Egan, R .L ., G allagher, H. S., Geller, H .,
Lindsay, J . P ., Robbins, L.C., & W hite, E.C. Reproducibility of the technic of
m am m ography (Egan) for cancer of the breast. American Jo u rn al of Surgery,
1 965,109,127-133.(18)
Clark, R .L., & Robbins, L.C. M ammography (Egan) in cancer of th e breast.
The A m erican Jo u rn al of Surgery, 1965, 209,125-126. (18)
Clarke, F.R . Confidence ratin g s, second-choice responses, and confusion
m atrices in intelligibility tests. Jo u rn al of the Acoustical Society of America,
1960, 32, 35-46. (22, 31)
Claudy, J.G . A comparison of five variable weighting procedures. Educational
and Psychological M easurem ent, 1972, 32, 311-322. (28)
Cocozza, J .J ., & Steadm an, H .J. Prediction in psychiatry: An example of
misplaced confidence in experts. Social Problems, 1978,25,265-276. (31)
Cohen, B .,& Lee, I.A catalog of risks. H ealth Physics, 1979,36,707-722.(33)
Cohen, B.L. P erspectives on the nuclear debate. B ulletin of th e Atomic
Scientists, 1974,30, 25-39. (33)
Cohen, J . The statistical power of abnormal-social psychological research.
Jo u rn al of Abnorm al and Social Psychology, 1962, 65,145-153. (2, 3)
Cohen, J . S tatistical power analysis in the behavioral sciences. New York:
Academic Press, 1969, (2)
Cohen, J ., Boyle, L.E., & Chesnick, E.I. P attern s of preference in locating
targ ets. Occupational Psychology, 1969, 43,129-144. (24)
Cohen, J . , Chesnick, E .I„ & H aran, D. A conf irm ation of the inertial-f effect
in sequential choice and decision. B ritish Jo u rn al of Psychology, 1 9 7 2 ,6 3 ,4 1 -
4 6.(1)
Cohen, J ., & Hansel, C.E. . Risk and gambling. New York: Philosophical
Library, 1956. (3)
Cohen, J ., & H ansel, C.E.M. The n a tu re of decisions in gam bling. Acta
Psychologies, 1958,13, 357-370. (24)
Cohen, J .J . A case for benefit-risk analysis. In H .J. Otway (Ed.), Risk vs.
b en efit: Solution o r dream (R eport LA-4860-MS). Los A lam os S cientific
Laboratory, Febru-ary 1972. (Available from the National Technical Information
Service.) (33)
Cohen, L. J . The probable and the provable. Oxford: Clarendon Press, 1977. (35)
Cohen, L. J . On the psychology of prediction: Whose is the fallacy? Cognition,
1979, 7, 385-407. (34)
Cohen, L. J . Can hum an irrationality be experim entally dem onstrated? The
Behavioral and B rain Sciences, 1981, 4, 317-331. (34)
Литература 601
Cohn, Н.Е. Mammography in its proper perspective. Surgery, Gynecology
and O bstetrics, 1972, 334,97-98. (18)
Coles, R. Shrinking history. New York Review of Books, P a rt I, February
2 2,1973, pp. 20,15-21; P a rt II, M arch 8,1 9 7 3 , pp. 20, 25-29. (23)
Collins, B.E., & Hoyt, M.F. Personal responsibility fo r consequences: An
in teg ra-tio n and extension of the forced-compliance literatu re. Jo u rn a l of
Experim ental Social Psychology, 1972,8, 558-593. (9)
Combs, B., & Slovic, P. Causes of death: Biased newspaper coverage and biased
judgm ents. Journalism Q uarterly, 1979, 56, 837-843,849. (33)
Commager, H.S. The nature and study of history. Columbus, Ohio: M errill,
1965. (23)
Committee on Government Operations. Teton Dam Disaster. W ashington,
D.C.: U.S. Government P rin tin g Office, 1976. (33)
Cooke, W .E. Forecasts and verifications in W estern A ustralia. M onthly
W eather Review, 1906, 34, 23-24. (22) (a)
Cooke, W .E. W eighting forecasts. M onthly W eather Review, 1906,34,274-
475. (22) (b)
Cox, D .R. Two fu r th e r applications of a model fo r b in ary regression.
Biometrica, 1958,45,562-565. (22)
Cronbach, L. J . Beyond the two disciplines of scientific psychology. American
Psychologist, 1975, 30,116-127. (19)
Grouse, T. The boys on the bus. New York: Random House, 1974. (7)
D’A ndrade, R.G. T rait psychology and com ponential analysis. A m erican
A nthropologist, 1965, 67, 215-228. (13)
Darley, J.M ., &Latane, B. Bystander intervention in emergencies: Diffusion
in responsibility. Journal of Personality and Social Psychology, 1968, 8, 377-
383. (7,10)
Darlington, R.B. Reduced-variance regression. Psychological Bulletin, 1978,
85,1238-1255. (28)
Davis, W .L., & Davis, D.E. Internal-external control and attribution of responsibil­
ity for success and failure. Journal of Personality, 1972,40,123-136. (9)
Dawes, R.M. A case study of graduate admissions: A pplication of three
principles of hum an decision m aking. A m erican Psychologist, 1971, 26, ISO-
188. (28)
Dawes, R.M. G raduate admissions criteria and fu tu re success. Science, 1975,
187,721-723.(28) (a)
Dawes, R.M. The mind, the model, and the task. In F. Restle, R.M. Shiffrin,
N. J . Castellan, H.R. Lindman & D.F. Pisoni (Eds.), Cognitive theory, Hillsdale,
N .J.: Erlbaum , 1975. (19) (b)
Dawes, R.M. Shallow Psychology. In J.S . Carroll & J.W . Payne (Eds.),
Cognition and social behavior. Hillsdale, N .J.: Erlbaum , 1976. (13, 28, 31)
Dawes, R .M . C onfidence in in te lle c tu a l ju d g m e n ts vs. confidence in
perceptual judgm ents. In E.D. Lanterm ann & H. Feger (Eds.), Sim ilarity and
Choice: Papers in honor of Clyde Coombs. Bern: Hans H uber, 1980. (31)
602 ЛИТЕРАТУРА
Dawes, R.M ., & Corrigan, В. Linear models in decision making. Psychological
B ulletin, 1974, 81, 95-106. (28)
D aw id, A. P. The w ell-calibrated B ayesian. J o u rn a l of th e A m erican
Statistical Association, in press. (22)
Deacon, E.B. A discrim in an t analysis of predictors of business failure.
Jo u rn a l of Accounting Research, 1972,10,167-179. (28)
DeCharms, R.C. Personal causation: The internal affective determ inants of
behavior. New York: Academic Press, 1968. (12,16)
Deci, E. E ffects of externally m ediated rew ards on intrinsic m otivation.
Jo u rn al of Personality and Social Psychology, 1971,18,105-115. (9)
De F inetti, B. La prevision: Ses lois logiques, ses sources subjecti ves. Annales
de IT n stitu t H enri Poincare, 1937,7,1-68. English translation in H .E.K yburg,
J r ., & H.E. Smokier (Eds.), Studies in subjective probability. New York: Wiley,
1964.(22)
De F inetti, B. Probability: Interpretations. In D.E. Sills (Ed.), International
Encyclopedia of the Social Sciences (Vol. 12). New York: Macmillan, 1968. Pp.
496-504.(1)
Degler, C.N. W hy historians change th eir minds. Pacific H istorical Review,
1976,48,167-189.(23)
DeGowin, E ., & DeGowin, R. Bedside diagnostic exam ination (2nd ed.). New
York: M acmillan, 1969. (18)
DeGroot, A.D. H et denken van den schaker [Thought and choice in chess].
The H ague, The N etherlands: Mouton, 1965. (28)
Del Regato, J . A. Diagnosis, treatm ent and prognosis, h i L. V. Ackerman (Ed.),
Cancer (4th Ed.) St. Louis: Mosby, 1970. (18)
DeLuca, J.T .A statistical comparison study of patients undergoing breast
biopsy a t a com m unity hospital over a 16-year period. Radiology, 1974, 222,
315-318.(18)
D ennett, D.C. B rainstorm s. Hassocks, England: H arvester, 1979. (35)
DeSmet, A. A ., Fryback, D.G., & T hom bury, J.R .A second look a t the u tility
of radiographic skull exam ination for traum a. American Jo u rn al of Radiology,
1979,132,95-99. (22)
D etm er, D.E., Fryback, D.G., & Gassner, K. H euristics and biases in medical
decision-m aking. Jo u rn al of Medical Education, 1978, 53, 682-683. (31)
Diaconis, P. Statistical problems in ESP research. Science, 1978, 201,131-
136. (23)
Dodson, J . D. Sim ulation system design fo r a TEAS sim ulation research
facility. (Tech. Rep. No. AFCRL-1112, PRC R-194). Los Angeles: Planning
R esearch Corpora-tion, November, 1961. (26)
Donchin, E., R itte r, W ., & McCallum, W.C. Cognitive psychophysiology:
The endogenous components of the ERP. In E. Callaway, P. Teuting, & S.H.
Koslow (Eds.), Event-related brain potentials in man. New York: Academic
Press, 1978. (35)
Литература 603
Dowie, J . On the efficiency and equity of betting m arkets. Economica, 1976,
43,139-150.(22,31)
Dowie, J . Personal communication. November 1980. (22)
Dreman, D. C ontrarian investm ent strategy. New York: Random House,
1979.(23,31)
Duncan- Johnson, C.C., & Donchin, E. On quantifying surprise: The variation
of event-related potentials w ith subjective probability. Psychophysiology, 1977,
14,456-467.(35)
Dunlap, T.R. Science as a guide in regulating technology: The case of DDT in
th e U nited States. Social Studies of Science, 1978,8, 265-285. (33)
Duval, S., & Hensley, V. Extensions of objective self-awareness theory: The
focus of attention-causal a ttrib u tio n hypothesis. In J.H . Harvey, W .L. Ickes,
& R.F. Kidd (Eds.), New directions in attrib u tio n research (Vol. 1). Hillsdale,
N .J.: Erlbaum , 1976. (9)
Duval, S ., & W icklund, R. A. A theory of objective self-awareness. New York:
Academic Press, 1972. (9)
Edwards, A.E. Experim ental design in psychological research. New York:
H olt, R inehart & W inston, 1960. (20)
E d w a rd s, D .D ., & E d w ard s, J .S . M arria g e: D ire c t an d c o n tin u o u s
m easurem ent. Bulletin of the Psychonomic Society, 1977, 20,187-188. (28)
E dw ards, W . O ptim al stra te g ie s fo r seeking in fo rm atio n : Models fo r
statistics, choice reaction times, and hum an inform ation processing. Journal
of M athem atical Psychology, 1965, 2, 312-329. (25)
Edwards, W . Nonconservative probabilistic inform ation processing systems.
(R eport ESD-TR-66-404). U.S. A ir Force, AF Systems Command. Electronic
Systems Division, Decision Sciences Laboratory, 1966. (25, 26)
E dw ards, W . C onservatism in h u m an in fo rm a tio n p ro cessin g . In B.
Kleinmuntz (Ed.), Formal representation of hum an judgment. New York: Wiley,
1968,17-52. (I, 2,3,8)
E dw ards, W . B ayesian and re g re ssio n m odels of h u m an in fo rm atio n
processing - a myopic perspective. O rgan izatio n al B ehavior and H um an
Perform ance, 1971, 6,639-648. (19)
Edwards, W . Comment. Jo u rn al of the American Statistical Association,
1975, 70, 291-293. (34)
Edwards, W . Technology for director dubious: Evaluation and decision in
public contexts. In K. R. Hammond (Ed.), Judgm ent and decision in public policy
form ation. Boulder, Colo.: W estview Press, 1978. (28)
Edw ards, W ., Lindman, H ., & Phillips, L.D. Em erging technologies for
m aking decisions. New directions in psychology (Vol. 2). New York: Holt,
R in ehart & W inston, 1965. (25)
Edwards, W ., Lindman, H ., & Savage, L.J. Bayesian statistical inference
for psychological research. Psychological Review, 1963, 70,193-242. (25)
E gan, R .L . F undam entals of m am m ographic diagnoses of benign and
m alignant diseases. Oncology, 1969,23,126-148. (18)
604 ЛИТЕРАТУРА
Egan, R.L. C ontributions of mammography in the detection of early breast
cancer. Cancer, 1971, 28,1555-1557. (18)
Egan, R.L. M ammography (2nd Ed.). Springfield, 111.: Charles C. Thomas,
1972.(18)
Einhorn, H .J. Expert measurement and mechanical combination. Organizational
Behavior and H um an Perform ance, 1972, 7,86-106. (28)
E inhorn, H. J . Decision errors and fallible judgm ent: Implications for social
policy. In K .R . H am m ond (Ed.), Ju d g m e n t and decision in public policy
form ation. Denver, Colo.: W estview Press, 1978. (23)
Einhorn, H .J. Personal communication, Jan u ary 1979. (28)
Einhorn, H. J ., & H ogarth, R.M. U nit weighting schemas for decision making.
O rganizational Behavior and Human Perform ance, 1975,13,171-192. (28)
Einhorn, H .J., & H ogarth, R.M. Confidence in judgm ent: Persistence in the
illusion of validity. Psychological Review, 1978,85,395-416. (9 ,1 9 ,2 8 ,3 4 )
Einhorn, H .J., & H ogarth, R.M. Behavioral decision theory: Processes of
judgm ent and choice. A nnual Review of Psychology, 1981,32, 53-88. (34, 35)
Einhorn, H .J., Kleinmuntz, D.N., & Kleinmuntz, B. Linear regression and
process tracing models of judgment. Psychological Review, 1979,86,465-485. (19)
Ellis, R. J . , & Holmes, J.G . Focus of attention in social interaction: The impact
on self evaluations. Unpublished m anuscript. O ntario, Canada: U niversity of
W aterloo, 1979. (9)
Etlsberg, D. R isk, am biguity, and the Savage axioms. Q uarterly Jo u rn al of
Economics, 1961,75, 643-699. (35)
Epstein, W ., & Rock, I. Perceptual set as an artifa c t of recency. American
Jo u rn al of Psychology, 1960, 73, 214-228. (35)
E rlick, D.E. H um an estim ates of sta tistic a l related n ess. Psychonom ic
Science, 1966, 5, 365-366. (15)
E rlick , D .E ., & M ills, R .G . P e rc e p tu a l q u a n tific a tio n of c o n d itio n a l
dependency. Jo u rn al of Experim ental Psychology, 1967, 73, 9-14. (15)
Estes, W .K . Probability learning. In A.W . Melton (Ed.), Categories of hum an
learning. New York: Academic Press, 1964. (2, 3)
Estes, W .K. The cognitive side of probability learning. Psychological Review,
1976, 83, 37-64.(19)
Evans, J.S t.B .T ., & Dusoir, A.E. Proportionality and sample size as factors
in in tu itiv e statistical judgm ent. A cta Psychologica, 1977, 41,129-137. (34)
Evans, J.S t.B .T ., & W ason, P.C. R ationalization in a reasoning task. B ritish
Jo u rn a l of Psychology, 1976, 67, 486-497. (34)
Fabricand, В. P. Horse sense. New York: David McKay, 1965. (22)
Fam a, E. F. Random walks in stock m ark et prices. Financial A nalysts
Jo u rn al, 1965, 21, 55-60. (23)
Feather, N.T. A ttribution of responsibility and valence of success and failure
in relation to in itial confidence and task perform ance. Jo u rn al of Personality
and Social Psychology, 1969,13,129-144. (9)
Литература 605
Feiler, W . A n introduction to probability theory and its applications (3rd
ed., Vol. 1). New York: W iley, 1968. (3, 23, 34)
F e rre ll, W .R ., & McGoey, P .J . A m odel of c alib ratio n fo r subjective
probabilities. Organizational Behavior and H um an Perform ance, 1980,26,32-
53.(22, 31)
Festinger, L. A theory of cognitive dissonance. Stanford: Stanford University
Press, 1957. (9,15)
F e s tin g e r, L. C o nflict, decision and dissonance. S ta n fo rd : S ta n fo rd
U niversity Press, 1964. (15)
Feyerabend, P. A gainst method. New York: NLB (Schocken), 1975. (23)
Fischer, D. H. H istorians’ fallacies. New York: H arper & Row, 1970. (23,31)
Fischhoff, В. H indsight foresight: The effect of outcome knowledge on
judgm ent u nder uncertainty. Jo u rn al of Experim ental Psychology: H um an
Perception and Perform ance, 1 9 7 5 ,1, 288-299. (23, 30, 31)
Fischhoff, В. A ttribution theory and j udgm ent under uncertainty. In N.H.
Harvey, W. J . Ickes, & R.F. Kidd (Eds.), New directions in attrib u tio n research.
Hillsdale, N J .: Erlbaum , 1976. (13)
Fischhoff, В. Cost-benefit analysis and the a rt of motorcycle m aintenance.
Policy Sciences, 1977, 8,177-202. (33) (a)
Fischhoff, В. Perceived informativeness of facts. Journal of Experimental
Psychology: Human Perception and Performance, 1977,3,349-358. (23,31,34) (b)
Fischhoff, В. Intuitive use of form al models, A comment on M orrison’s
“Q uantitative Models in H istory.” H istory and Theory, 1978,17, 207-210. (23)
Fischhoff, В. Latitude and platitudes. How m uch credit do people deserve?
In G. Ungson & D. B raunstein (Eds,), New directions in decision making. New
York: K ent, in press. (31) (a)
Fischhoff, В. No m an is a discipline. In J . Harvey (Ed.), Cognition, social
behavior and the environm ent. Hillsdale, N. J .: Erlbaum , in press. (23) (b)
Fischhoff, В., & Bar-Hillel, M, Focusing techniques as aids to inference
(Decision Research Report 80-9). Eugene, Oreg.: Decision Research, 1980. (10,34)
F isch h o ff, В ., & B eyth, R. “I knew it w ould h ap p en ” - Rem em bered
p ro babilities of o n ce-future th in g s. O rganizational B ehavior and H um an
Perform ance, 1975,13,1-16. (22,23,31)
Fischhoff, В., Goitein, В., & Shapira, Z. The experienced u tility of expected
u tility approaches. In N. F eather (Ed.), Expectancy, incentive and action.
Hillsdale, N .J.: Erlbaum, in press. (23)
Fischhoff, В., Lichtenstein, S ., Slovic, P ., Derby, S., & Keeney, R. Acceptable
risk. New York: Cambridge U niversity Press, 1981. (33)
Fischhoff, В ., & MacGregor, D. Judged lethality (Decision Research Report
80-4). Eugene, Oreg.: Decision Research, 1980. (33)
Fischhoff, В., & Slovic, P. A little learning...: Confidence in m ulticue
judgm ent. In R, Nickerson (Ed.), A ttention and Perform ance VIII. Hillsdale,
N .J.: Erlbaum , 1980, (22,23,31)
606 ЛИТЕРАТУРА
Fischhoff, В., Slovic, Р ., & Lichtenstein, S. Knowing w ith certainty; The
appropri-ateness of extrem e confidence. Jo u rn al of Experim ental Psychology:
H um an Percep-tion and Perform ance, 1977,3, 552-564. (22, 2 3 ,3 1 ,3 3 )
Fischhoff, В., Slovic, P ., & L ichtenstein, S. F a u lt trees: S en sitiv ity of
e s tim a te d f a ilu re p ro b a b ilitie s to p roblem re p re s e n ta tio n . J o u r n a l of
Experim ental Psychology: H um an Perception and Perform ance, 1978,4, 330-
334. (19, 23, 33, 34)
Fischhoff, В., Slovic, P ., & Lichtenstein, S. Subjective sensitivity analysis.
O rganiza-tional Behavior and H um an Perform ance, 1979,23,339-359. (10,34)
F ischhoff, В., Slovic, P ., & L ichten stein , S. K now ing w hat you w ant:
M easuring labile values. In T. W atlsten (Ed.), Cognitive processes in choice and
decision behavior. Hillsdale, N .J.: Erlbaum , 1980. (19, 33)
Fischhoff, В., Slovic, P ., Lichtenstein, S., Read, S., & Combs, B. How safe is
safe enough? A psychometric study of attitudes towards technological risks and
benefits. Policy Sciences, 1978, 9,127-152. (33)
Fiske, S.T., Taylor, S.E., Etcoff, N ., & Läufer, J . Imaging, em pathy and
causal attrib u tio n . Jo u rn al of Experim ental Social Psychology, 197 9 ,1 5 ,3 5 6 -
377.(13)
Fitch, G. Effects of self-esteem, perceived performance, and chance on causal
attributions. Journal of Personality and Social Psychology, 1970,16,311-315. (9)
Florovsky, G. The study of the past. In R. H. N ash (Ed.), Ideas of history
(Vol. 2). New York: D utton, 1969. (23)
Forrester, J . W . W orld dynamics. Cambridge: W right-A lien, 1971. (11)
F oss, D. J . , & B lank, M. A. Id e n tify in g th e speech codes. C ognitive
Psychology, 198 0 ,1 2 ,1 -3 1 . (35)
Freize, I., & W einer, B. Cue utilization and a ttrib u tio n al judgm ents for
success and failure. Jo u rn al of Personality, 1971,39, 591-606. (9)
Friedm an, A .K ., A shovitz, S.I., Berger, S.M., Dodd, M.D., Fisher, M.S.,
Lapayowker, M.S., Moore, J .P ., Parlee, D.E., Stein, G.N., & Pendergrass, E.P.
A co o p erativ e ev alu a tio n of m am m ography in seven teach in g h o sp ita ls.
Radiology, 1966,86,886-891. (18)
Fryback, D.G. Use of radiologists’ subjective probability estim ates in a
m edical decision m ak in g problem . (M ichigan M ath em atical Psychology
Program , R eport No. 74-14). A nn Arbor: U niversity of M ichigan, 1974. (22)
Furby, L. Interpreting regression toward the mean in developmental research.
Developmental Psychology, 1973, 8,172-179. (23)
G albraith, R.C., & Underwood, B .J. Perceived frequency of concrete and
abstract words. Memory and Cognition, 1973,1, 56-60. (1)
Gallic, W .B. Philosophy and the historical understanding. London; Chatto
& W indus, 1964.(23)
G arcia, J . , McGowan, B .K ., & Greene, K.F. Sensory quality and integration:
C onstraints on conditioning. In A.H. Black & W .F. Prokasy (Eds.), Classical
conditioning II: C urrent research and theory. New York: Appleton-Century-
C rofts, 1972.(15)
Литература 607
G ard in er, Р.С ., & E dw ards, W . Public values: M u lti-a ttrib u te -u tility
measurem ent for social decision making. In M.F. Kaplan & S. Schwartz, (Eds.),
Human judgm ent and decision processes. New York: Academic Press, 1975. (28)
G arner, W .R. Good patterns have few alternatives. American Scientist, 1970,
58(1), 34-43. (3)
Gershon-Cohen, J . , & Borden, A.G.G. Biopsy and m am m ography. New York
State Jo u rn al of Medicine, 1964, 2751-2756. (18)
G ettys, C.F., & W illke, T.A. The application of Bayes’ theorem when the
tru e data state is uncertain. Organizational Behavior and Human Performance,
1969,4,125-141.(26)
G inosar, Z., & Trope, Y. The e ffe cts of base ra te s and in d iv id u a tin g
inform ation on judgm ents about another person. Journal of Experim ental Social
Psychology, 1980,16,228-242. (10)
Glanzer, M., & Clark, W .H. Accuracy of perceptual recall: A n analysis of
organization. Journal of Verbal Learning and Verbal Behavior, 1 9 6 3 ,1, 289-
299. (3)
Goethals, G .R ., & Reckman, R.F. The perception of consistency in attitudes.
Jo u rn al of Experim ental Social Psychology7, 1973,9, 491-501, (32, 34)
Goffm an, E. Interaction ritual. New York: Anchor, 1967. (16)
Gold, R.H . The accuracy of m ammography in the diagnosis of benign and
m alignant disease. Oncology, 1969,23,159-163. (18)
Goldberg, L.R. The effectiveness of clinician’s judgm ents: The diagnosis of
organic brain damage from the Bender-Gestalt Test. Jo u rn al of Consulting
Psychology, 1959, 23, 25-33. (20)
Goldberg, L. R. Diagnosticians vs. diagnostic signs: The diagnosis of psychosis
vs. neurosis from the MMPI. Psychological Monographs, 1965, 79. (28)
G oldberg, L.R . Seer over sign: The f ir s t “good” exam ple? J o u rn a l of
Experim ental Research in Personality, 1968,3,168-171. (28) (a)
Goldberg, L.R. Simple models o r simple processes? Some research on clinical
judgm ents. Am erican Psychologist, 1968, 23,483-496. (23,34) (b)
Goldberg, L.R. Man vs. model of man: A rationale, plus some evidence, for a
m ethod of im proving on clinical inferences. Psychological Bulletin, 1970, 73,
422-432. (23, 28)
G oldberg, L.R . P a ra m e ters of p erso n ality in v en to ry c o n stru ctio n and
u tiliz a tio n com parison of p red ictio n stra te g ie s and tactics. M u ltiv ariate
Behavioral Research Monographs, 1972, 72,1-59. (28)
Goldberg, L.R. Man vs. model of man: J u s t how conflicting is th a t evidence?
O rganizational Behavior and H um an Perform ance, 1976,16, 13-22.(28)
Goldberg, P. A re women prejudiced against women? Trans-Action, A pril
1968, 28-30. (15)
Golding, S.L ., & Rorer, L.G. Illusory correlation and the learning of clinical
judgm ent. Jo u rn al of Abnormal Psychology, 1972, SO, 249-260. (15)
Goldman, A.I. Epistemics: The regulative theory of cognition. Journal of
Philosophy, 1978,75, 509-523. (32)
608 ЛИТЕРАТУРА
Goodfellow, L. D. A psychological interpretation of the results of the Zenith
radio experim ents in telepathy. Journal of Experim ental Psychology, 1938,23,
601-631 (3)
Gray, C.W. Predicting w ith intuitive correlations. Psychonomic Science,
1 9 6 8 ,1 1 ,4 1 -4 2 .(4 )
Green, B .F .,Jr. Param eter sensitivity in m ultivariate methods. M ultivariate
Behav-ioral Research, 1977, 3, 263. (28)
Green, D.M ., & Swets, J . A. Signal detection theory and psychophysics. New
York: W iley, 1966. (22)
Greenwald, A. G. The totalitarian ego; Fabrication and revision of personal
history. Unpublished m anuscript, 1978. (12)
G reenw ald, A .G ., & A lbert, R.D. A cceptance and recall of im provised
argum ents. Jo u rn al of Personality and Social Psychology, 1968,8, 31-34. (12)
Greenwald, A.G., & Sakum ura, J.S . A ttitu d e and selective learning: W here
are the phenomena of yesteryear? Journal of Personality and Social Psychology,
1957, 7, 387-397. (12)
G rether, D.M. Bayes’ rule as a descriptive model: The representativeness
heuristic (Social Science W orking Paper No. 245). Pasadena: California Institute
of Tech-nology, 1979. (34)
G rether, D.M., & Plott, C.R. Economic theory of choice and the preference
reversal phenomenon. A m erican Economic Review, 1979, 69, 623-638. (19,
33,34)
Grice, H .P. Logic and conversation. In D. Davidson and G. H arm an (Eds.),
The logic of gram m ar. Encino: Dickenson, 1975. (34)
Gross, A. Evaluation of the ta rg e t person in a social influence situation.
U npublished doctoral dissertation, Stanford U niversity, 1966. (9)
G runeberg, M.M., M orris, P.E ., & Sykes, R.N. (Eds.), Practical aspects of
memory. London: Academic Press, 1978. (31)
G uilford, J .P . Psychometric methods. New York: McGraw-Hill, 1954. (4)
H acking, I. The emergence of probability. London: Cambridge U niversity
P ress, 1975. (32)
H am ill, R ., W ilson, T.D ., & N isbett, R.E. In sen sitiv ity to sample bias:
Generalizing from atypical cases. Journal of Personality and Social Psychology,
1980, 39, 578-589. (9, 32, 34)
H am ilton, D.L.A cognitive attrib u tio n al analysis of stereotyping. In L.
Berkowitz (Ed.), Advances in experim ental social psychology (Vol. 12). New
York: Academic Press, 1979. (9)
H am ilton, D.L., & Rose, T.R. Illusory correlation and the m aintenance of
stereotype beliefs. Unpublished m anuscript, U niversity of California a t Santa
B arbara, 1978. (13)
H am lin, R.M. The clinician as judge: Im plications of a series of studies.
Jo u rn al of Consulting Psychology, 1954,18, 233-238. (20)
H am m erto n , M. A case of ra d ic al p ro b a b ility e stim a tio n . J o u rn a l of
Experim ental Psychology, 1973, 202, 252-254. (10)
Литература 609
H am m ond, K .R . P ro b a b ilistic fu n c tio n in g an d th e clin ical m ethod.
Psychological Review, 1955, 62,255-262. (28)
Hammond, K.R. Toward increasing competence of thought in public policy
form ation. In K.R. Hammond (Ed.), Judgm ent and decision in public policy
form ation. Boulder, Colo.: W estview Press, 1978. (19)
Hammond, K .R ., & Adelman, L. Science, values, and hum an judgm ent.
Science, 1976,194, 389-396. (28)
Hammond, K. R ., McClelland, G. H ., & Mumpower, J . H um an judgm ent and
decisionm aking: Theories, methods and procedures. New York: Praeger, 1980.
(34)
H ansen, R .D ., & Donoghue, J.M . The power of consensus: Inform ation
derived from one’s own and others’ behavior. Jo u rn al of Personality and Social
Psychology, 1977, 35, 294-302. (10)
H ansen, R.D ., &Lowe, C.A. Distinctiveness and consensus: The influence of
behavioral info rm ation on a cto rs’ and observers’ a ttrib u tio n s. Jo u rn a l of
Personal-ity and Social Psychology, 1976, 34,425-433. (10)
H art, J.T . Memory and the m em ory-m onitoring process. Jo u rn al of Verbal
Learning and Verbal Behavior, 1967, 6,686-691. (11)
H artshom e, H ., & May, M.A. Studies in the natu re of character (Vol. 1),
Studies in deceit. New York: Macmillan, 1928. (15)
H astie, R ., & K um ar, P. A. Person memory: Personality tra its as organizing
principles in memory for behavior. Jourr. al of Personality and Social Psychology,
1979, 37, 25-38. (9)
H athaw ay, S.R. Clinical in tu itio n and in feren tial accuracy. Jo u rn a l of
Personality, 1956, 24, 223-250. (20)
H ayes, J .R ., & Simon, H.A . Psychological differences am ong problem
isomorphe. In N .J. Castellan, J r ., D.B. Pisoni, & G.R. P otts (Eds.), Cognitive
theory. Hillsdale, N .J.: Erlbaum, 1977. Vol. 2. (34)
H azard, T.H ., & Peterson, C.R. Odds versus probabilities for categorical
events (Tech. Rep. (73-2). McLean, Va.: Decisions and Designs, Inc., 1973. (22)
Hedges, L.V., & Olkin, I. Vote counting m ethods on research synthesis.
Psychological Bulletin, I960,88,359-369. (31)
Heider, F. Social perception and phenomenal causality. Psychological Review,
1944,51,358-373.(9)
Heider, F. The psychology of interpersonalrelations. New York: Wiley, 1958. (8,9)
H endrick, I. The discussion of the “In stin ct to M aster.” Psychoanalytic
Q uarterly, 1943,12,561-565. (16)
H enrion, M. Assessing probabilities: A review. P ittsburgh, Pa.: Camegie-
Mellon U niversity, D epartm ent of Engineering and Public Policy, 1980. (31)
H enslin, J.M . Craps and magic. A m erican Jo u rn al of Sociology, 1967, 73,
316-330.(16)
H erm stein, R. J . On the law of effect. Jo u rn al of the Experim ental Analysis
of Behavior, 1970,13, 243-266. (35)
610 ЛИТЕРАТУРА
H ershey, J.C ., & Schoemaker, P .J.H . Risk taking and problem context in
the domain of losses: An expected u tility analysis. Journal of Risk and Insurance.
1980, 47,111-132. (33)
Hession, E., & M cCarthy, E. H um an perform ance in assessing subjective
probability distributions. Unpublished m anuscript, September, 1974. (Available
from D epart-m ent of Business A dm inistration, U niversity College Dublin,
Belfield, Dublin 4, Ireland.) (22)
H exter, J.H . The history prim er. New York: Basic Books, 1971. (23)
H oerl, A .E., & Fallin, H.K. Reliability of subjective evaluations in a high
incentive situation. Jo u rn a l of the Royal Statistical Society (Series A), 1974,
337, 227-230. (22)
H offm an, P .J . The param orphic re p re se n ta tio n of clinical ju d g m en t.
Psychological B ulletin, 1960, 57,116-131. (23,28)
H o g a rth , R.M . C ognitive processes and th e assessm ent of su b jectiv e
probability distributions. Journal of the American Statistical Association, 1975,
7 0 ,2 7 1 -2 8 9 .(1 9 ,3 1 )
Hohenemser, K.H. The failsafe risk. Environm ent, 1975,17(1), 6-10. (33)
Holdren, J . P. The nuclear controversy and the lim itations of decision making
by experts. B ulletin of the Atomic Scientists, 1976, 32, 20-22, (33)
Holmes, D. S. Dimensions of projection. Psychological Bulletin, 1968, 69,
248-268. (9)
H olt, R .R. Y et another look a t clinical and statistical prediction. American
Psychologist, 1970, 25, 337-339. (28)
H orow itz, L.M ., N orm an, S.A., & Day, R.S. A vailability and associative
sym m etry. Psychological Review, 1966, 73,1-15. (11)
Hovland, C.I. Reconciling conflicting results derived from experim ental and
survey studies of a ttitu d e change. A m erican Psychologist, 195 9 ,1 4 ,8 -1 7 , (8)
H ovland, C.I., Mandell, W ., Campbell, E.H ., & Brock, T., Luchins, A .S.,
Cohen, A .R ., McGuire, W .J., Janis, I.L., Feierabend, R.L., & A nderson, N.H.
The effects of “com m itm ent” on opinion change following communication. In
C.I. H ovland et al., (Eds.), The order of presentation in persuasion. New Haven:
Yale U niversity Press, 1957. (9)
H ow ard, J .W ., & Dawes, R.M. L inear prediction of m a rita l happiness.
Personality and Social Psychology Bulletin, 1976,2,478-480. (28)
Howell, W .C ., & B u rn e tt, S.A. U n certain ty m easurem ent: A cognitive
taxonom y. O rganizational Behavior and H um an Perform ance, 1978, 22, 45-
68. (31, 35)
Howell, W .C ., G ettys, C., & M artin , D. On th e allocation of inference
f u n c tio n s in d e c isio n s y ste m s. O rg a n iz a tio n a l B e h a v io r a n d H u m a n
Perform ance, 1971, 6,132-149. (26)
H untsberger, D.V. Elements of statistics (2nd ed.). Boston: Allyn & Bacon,
1967. (15)
H ynes, M ., & V anm arcke, E. R eliab ility of em bankm ent perform ance
predictions. Proceedings of the ASCE Engineering Mechanics Division Specialty
Литература 611
Conference. W aterloo, Ontario, Canada: U niversity of W aterloo Press, 1976.
(31, 33)
Ittelson, W .H ., & K ilpatrick, F.P. Experim ents in perception. Scientific
Am erican, 1951,185,50-55. (35)
Jan is, I. Victims of groupthink. Boston: H oughton M ifflin, 1972. (8 ,2 3 ,3 4 )
Jan is, I.L., & Mann, L. Decision m aking. New York: Free Press, 1977. (34)
Jenkins, H.M., & W ard, W.C. Judgm ent of contingency between responses
and outcomes. Psychological Monographs, 1965, 79. (1 1 ,1 5 ,1 9 )
Jennergren, L.P., & Keeney, R.L. Risk assessment. In Handbook of applied
systems analysis. Laxenberg, A ustria: IIASA, in press. (31, 33)
Jennings, D.L., Lepper, M.R., & Ross, L. Persistence of impressions of personal
persuasiveness: Perseverance of erroneous self assessments outside the debriefing
para-digm. Unpublished m anuscript, Stanford University, 1980. (9,15)
Jervis, R. Perception and misperception in international relations. Princeton:
Princeton U niversity Press, 1975. (8, 34)
Johnson, D.M. Systematic introduction to the psychology of thinking. New
York: H arper & Row, 1972. (4)
Jo h n so n , T .J ., Feigenbaum , R ., & W eiby, M. Some d e term in a n ts and
consequences of the teacher’s perception of causation, journal of Experim ental
Psychology, 1964, 55, 237-246. (9)
Johnson-Laird, P.N ., Legrenzi, P ., & Sonino-Legrenzi, M. Reasoning and a
sense of reality. B ritish Journal of Psyc hology, 1972, 63,395-400. (6,34)
Johnson-Laird, P.N ., & W ason, P.C. A theoretical analysis of insight into a
reasoning task. In P.N . Johnson-L aird and P.C. W ason (Eds.), Thinking.
Cambridge: Cambridge U niversity Press, 1977. (6,34)
Jones, E.E., & Davis, K.E. From acts to dispositions: The attribution process
in person perception. In L. Berkowitz (Ed.), Advances in experim ental social
psychology (Vol. 2). New York: Academic Press, 1965. (9,13)
Jones, E.E., Davis, K .E., & Gergen, K. Role playing variations and th eir
inform ational value for person perception. Jo u rn al of Abnormal and Social
Psychology, 1961, 63,302-310. (9)
Jones, E.E., & DeCharms, R. Changes in social perception as a function of
the personal relevance of behavior. Sociametry, 1957, 20, 75-85. (9)
Jo n es, E .E ., & H a rris, V.A. The a ttrib u tio n of a ttitu d e s . J o u rn a l of
Experim ental Social Psychology, 1967, 3,1-24. (9)
Jones, E.E., Kanouse, D.E., Kelley, H.H ., Nisbett, R.E., Valins, S., & W einer,
B. A ttribution: Perceiving the causes of behavior. M orristown, N .J.: General
Learning Press, 1971. (8 ,9 ,1 5 )
J o n e s, E .E ., & N isb e tt, R .E . The a c to r and th e o b serv er: D iv erg en t
perceptions of the causes of behavior. In E.E. Jones, D. Kanouse, H.H. Kelley,
R.E. N isbett, S. Valins, & B. W einer, A ttribution: Perceiving the causes of
behavior. M orristown, N. J.: General Learning Press, 1971. (9 ,1 1 ,1 2 )
Jones, J.M . Prejudice and racism. Reading, Mass.: Addison-Wesley, 1972. (15)
Jones, M.R. From probability learning to sequential processing: A critical
612 ЛИТЕРАТУРА
review. Psychological Bulletin, 1971, 76,153-185. (3)
K adane, J . Personal communication, November 1980. (22)
K ahnem an, D., & Tversky, A. On prediction and judgm ent. ORI Research
M onograph, 1972,12(4). (10) (a)
K ahnem an, D ., & T versky, A. Subjective probability: A ju d g m e n t of
representativeness. Cognitive Psychology, 1972,3,430-454. ( 1 ,4 ,5 ,6 ,1 1 ,2 3 ,
32, 34) (b)
K ahnem an, D ., & Tversky, A. On the psychology of prediction. Psychological
Review, 1973, 80, 237-251. (1, 5, 6, 7 ,8 ,9 ,1 0 ,1 3 ,1 5 ,1 8 , 23, 27, 30,34)
K ahnem an, D., & Tversky, A. Intuitive prediction: Biases and corrective
proce-dures. TIMS Studies in M anagement Science, 1979,12, 313-327. (8, 33,
3 4 ,3 5 ) (a)
K ahnem an, D ., & Tversky, A. Prospect theory: An analysis of decisions under
risk. Econometrica, 1979,47, 263-291. (19, 33) (b)
K asper, R. G. “R eal” vs. perceived risk: Im plications for policy. In G.T.
Goodman & W .D. Rowe (Eds.), Energy risk managem ent. London: Academic
P ress, 1979. (33)
K assin, S.M. Base rates and prediction: The role of sample size. Personality
and Social Psychology B ulletin, 1979, 5, 210-213. (10) (a)
K assin, S. M. Consensus inform ation, prediction, and causal attribution: A
review of the literatu re and issues. Journal of Personality and Social Psychology,
1979, 37,1966-1981. (10) (b)
K ates, R. W . H azard and choice perception in flood plain m anagem ent
(R esearch P aper No. 78). Chicago: U niv ersity of Chicago, D epartm ent of
Geography, 1962. (23, 33)
Katz, D., & Allport, F. Students’ attitudes. Syracuse: Craftsman Press, 1931. (9)
K aufm an, M.T. The New York Times, October 18,1973. (7)
Kelley, H. H. A ttrib u tio n theory in social psychology. In D. Levine (Ed.),
N ebraska Symposium on M otivation: 1967. Lincoln: U niversity of N ebraska
P ress, 1967,192-241. (7, 9 ,1 3 ,1 5 )
Kelley, H.H. A ttribution in social interaction. InE.E. Jones, D. Kanouse, H.H.
Kelley, R.E. N isbett, S. Valins, & B. W einer (Eds.), A ttribution: Perceiving the
causes of behavior. M orristown, N .J.: General Learning Press, 1971. (9,15)
Kelley, H.H . The process of causal attribution. American Psychologist, 1973,
28,107-128. (9,15)
Kelley, H .H ., & Stahelski, A. J . Social interaction basis of cooperators’ and
com petitors’ beliefs about others. Journal of Personality and Social Psychology,
1 9 7 0 ,1 6 ,6 6 -9 1 .(9 )
Kelly, L. Evaluation of the interview as a selection technique. In Proceedings
of the 1953 In v itational Conference on Testing Problem s. Princeton, N .J.:
Educational Testing Service, 1954. (28)
Kelman, H.C. The hum an use of hum an subjects: The problem of deception
in social psychological experim ents. In A.G. M iller (Ed.), The social psychology
of psychological research. New York: Macmillan, 1972. (9)
Литература 613
Kidd, J.B . The utilization of subjective probabilities in production planning.
A cta Psychologica, 1970, 34, 338-347. (30)
K ilpatrick, F.P. Explorations in transactional psychology. New York: New
York U niversity Press, 1961. (35)
King, J .F ., Zechmeister, E.B., & Shaughnessy, J. J . Judgm ent of knowing: The
influence of retrieval practice. American Journal of Psychology, in press. (31)
K oltuv, B. Some c h a ra c te ristic s of in tra ju d g e tr a it in te rc o rre la tio n s.
Psychological M onographs, 1962, 76. (15)
K oriat, A., Lichtenstein, S., & Fischhoff, В. Reasons for confidence. Journal
of Experim ental Psychology: H um an Learning and Memory, 1980,6,107-118.
(22, 23, 31)
K ostlan, A. A m ethod for the empirical study of psychodiagnosis. Jo u rn al of
Consulting Psychology, 1954,18, 83-88. (20)
K rantz, D.H. M easurement structures and psychological laws. Science, 1972,
175,1427-1435. (28)
K ra n tz , D .H ., Luce, R .D ., Suppes, P ., & Tversky, A. F oundations of
m easurem ent (Vol. 1). New York: Academic Press, 1971. (28)
K ruskal, W ., & M osteller, F. R epresentative sam pling I: N on-scientific
literature. International Statistical Review, 1979, 47,13-24. (6) (a)
Kruskal, W ., & Mosteller, F. Representative sampling II: Scientific literature
excluding statistics. International Statistical Review, 1979,47,111-127. (6) (b)
K uhn, T, The stru c tu re of scientific revolution. Chicago: U niversity of
Chicago Press, 1962. (8, 23)
K ushner, R. Breast cancer-”The n ig h t I found out. ” San Francisco Chronicle,
M arch 24,1976. (18)
Lakatos, I. Falsification and scientific research programmes. In i. Lakatos &
A. M usgrave (E ds.), C riticism an d th e g ro w th of scie n tific know ledge.
Cambridge: Cambridge U niversity Press, 1970. (23)
Langer, E .J., Taylor, S .E ., Fiske, S.T., & Chanowitz, B. Stigma, starin g and
discom fort: A novel stim u lu s hypothesis. J o u rn a l of E xperim ental Social
Psychology, 1976, 72, 451-463. (13)
Lanir, Z. Critical revaluation of the strategic intelligence methodology. Tel
Aviv: Center fo r Strategic Studies, Tel Aviv U niversity, 1978. (23)
Larkin, J ., McDermott, J ., Simon, D .P., & Simon, H.A. Expert and novice
perform ance in solving physics problems. Science, 1980, 208,1335-1342. (34)
Larson, J .R ., & Reenan, A.M. The equivalence interval as a m easure of
uncertainty. O rganizational Behavior and H um an Perform ance, 1979, 23, 49-
55. (22, 31)
Lepper, M .R ., & G reene, D. T u rn in g play in to w ork: E ffects of a d u lt
surveillance and extrinsic rewards on children’s intrinsic m otivation. Journal
of Personality and Social Psychology, 1975, 31,479-486. (9)
Lepper, M .R., & Greene, D. The hidden costs of rew ard. Hillsdale, N .J.:
Erlbaum , 1978. (9)
Lepper, M .R., Greene, D., & N isbett, R.E. U nderm ining children’s intrinsic
614 ЛИТЕРАТУРА
interest w ith extrinsic reward: A test of the overjustification hypothesis. Journal
of Personality and Social Psychology, 1973, 28,129-137. (9)
Lepper, M .R., Ross, L., & Lau, R. Persistence of inaccurate and discredited
personal im pressions: A field dem onstration of a ttrib u tio n al perseverance.
U npublished m anu-script, Stanford U niversity, 1979. (9)
Lesnick, G. J . Mammography: A word of caution. New York State journal of
Medicine, 1966, 2005-2008. (18)
Libby, R. Man versus model of man: Some conflicting evidence. Organizational
Behavior and H itm an Perform ance, 1976,16,1-12. (28)
Lichtenstein, S., & Fischhoff, В. Do those who know more also know more
a b o u t how m uch th e y know ? The c a lib ra tio n of p ro b ab ility ju d g m e n ts.
O rganizational Behavior and H um an Perform ance, 1977,20,159-183. (22,31)
Lichtenstein, S., & Fischhoff, В. How welt doprobability experts assess probability?
(Decision Research Report 80-5). Eugene, Oreg.: Decision Research, 1980. (22) (a)
Lichtenstein, S., & Fischhoff, В. Training for calibration. O rganizational
Behavior and H um an Perform ance, 1980,26,149-171. (22, 31) (b)
Lichtenstein, S., & Fischhoff, В. The effects of gender and instructions on
Calibra-tion (Decision Research Report 81-5). Eugene, O reg.: Decision Research
1981.(22)
Lichtenstein, S., Fischhoff, В., & Phillips, L.D. Calibration of probabilities:
The state of the art. In H. Jungerm ann & G. deZeeuw (Eds.), Decision m aking
and change in hum an affairs. Am sterdam : D. Reidel, 1977. (33)
Lichtenstein, S ., & Slovic, P. Reversal of preferences between bids and choices
in gam bling decisions. Journal of Experim ental Psychology, 1971, 89, 46-55.
(19, 3 3 ,3 4 )
Lichtenstein, S., & Slovic, P. Response-induced reversals of preference in
gam bling; A n extended replication in Las Vegas. Jo u rn a l of E xperim ental
Psycholo-gy, 1973,101,16-20. (33, 34)
Lichtenstein, S., Slovic, P ., Fischhoff, В., Layman, M., & Combs, B. Judged
frequency of le th a l events. Jo u rn a l of E xperim ental Psychology. H um an
Learning and Memory, 1978,4, 551-578. (33)
L indm an, H .G ., & E dw ards, W . S up p lem en tary re p o rt: L earn in g th e
gam bler’s fallacy. Journal of Experim ental Psychology, 1961,62, 630. (23)
Loftus, E.F. Eyewitness testim ony. Cambridge, Mass.: H arvard U niversity
Press, 1979. (34)
Loftus, E .F., & Palm er, J.C . Reconstruction of automobile destruction: An
example of the interaction between language and memory. Jo u rn al of Verbal
Learning and Verbal Behavior, 1974,16, 585-589. (34)
L ord, C., L epper, M .R ., & R oss, L. Biased assim ila tio n and a ttitu d e
polarization: The effects of prior theories on subsequently considered evidence.
Jo u rn al of Personality and Social Psychology, 1979, 37,2098-2110. (9,15)
Ludke, R .L., Stauss, F.F., & G ustafson, D. H. Comparison of five methods
fo r estim ating subjective probability distributions. Organizational Behavior and
H um an Perform ance, 1977,19,162-179. (31)
Литература 615
Lusted, L. В. Introduction to medical decision making. Springfield, 111.:
Charles C Thomas, 1968. (18)
Lusted, L. B. A study of the efficacy of diagnostic radiologic procedures: Final
re p o rt on diagnostic efficacy. Chicago: Efficacy S tudy Com m ittee of th e
A m erican College of Radiology, 1977. (22,31)
Lusted, L.B., Bell, R .S., Edw ards, W ., R oberts, H.V ., & W allace, D.L.
E valuating th e efficacy of radiologic procedures by Bayesian m ethods: A
progress report. In K .J. Snapper (Ed.). Models in m etrics fo r decision makers.
W ashington, D.C.: Inform ation Resources Press, 1977. (18)
Lynn, R. A ttention, arousal and the orientation reaction. Oxford: Pergamon,
1966. (35)
Lyon, D., & Slovic, P. Dominance of accuracy inform ation and neglect of base
rates in probability estimation. ActaPsychologica, 1976,40, 287-298. (10,18)
Lyons, A.S. Aids to the surgeon by mammography. Mt. Sinai Jo u rn al of
Medicine, New York, 1975,42,223-231. (18)
Machover, K. Personality projection in the draw ing of the hum an figure.
Springfield, 111.: Charles C Thomas, 1949. (17)
Malpass, R.S. Effects of attitu d e on learning and memory. The influence of
instruction-induced sets. Journal of Experim ental Social Psychology, 1969, 5,
441-453.(12)
M anis, M., Dovalina, I., Avis, N .E., & Cardoze, S. Base rates can affect
individual predictions. Journal of Personality and Social Psychology, 1980,38,
231-248. (10)
Markman, E.M. Realizing that you don’tunderstand: Elementary schoolchildren’s
awareness of inconsistencies. Child Development, 1979,50,643-655. (31)
M arkovic, M. Social determ inism and freedom . In H.E. K iefer & M.K.
M unitz, (Eds.), Mind, science and history. Albany, N.Y.: State U niversity of
New York Press, 1970. (23)
M arquardt, D .W ., & Snee, R.D. R idge regression in practice. A m erican
Statistician, 1975, 29(1), 3-19. (28)
Marwick, A. The nature of history. London: Macmillan, 1970. (23)
Mayzner, M.S., &Tresselt, M.E. Tables of single-letter and bigram frequency
counts for various word-length and letter-position combinations. Psychonomic
M onograph Supplements, 1965,1,13-32 . (11)
M cA rth u r, C. A nalyzing th e clin ical process. J o u rn a l of C ounseling
Psychology, 1 9 5 4 ,1, 203-207. (20)
M c A rth u r, L.Z. The how an d w h a t o f why: Some d e te rm in a n ts and
consequences of c au sa l a ttrib u tio n . J o u rn a l o f P e rs o n a lity an d Social
Psychology, 1972, 22,171-193. (7, 9)
M cA rthur, L.Z. The lesser influence of consensus th a n d istinctiveness
inform ation on causal a ttrib u tio n s: A te st of the person-thing hypothesis.
Jo u rn al of Personality and Social Psychology, 1976,33, 733-742. (9)
M cA rthur, L.Z., & Post, D. Figural emphasis and person perception. Journal
of Experim ental Social Psychology, 1977,13, 520-535. (9)
616 ЛИТЕРАТУРА
M cA rthur, L.Z., & Solomon, L.K. Perceptions of an aggressive encounter as
a fu n ctio n of th e v ictim ’s salience and th e perceiver’s arousal. Jo u rn a l of
Personality and Social Psychology, 1978, 36,1278-1290. (9)
McCauley, C., & S titt, C.L. A n individual and q u a n tita tiv e m easure of
stereotypes. Journal of Personality and Social Psychology, 1978,36,929-940. (10)
McClelland, G ., & Rohrbaugh, J . W ho accepts the Pareto axiom? The role of
u tility and equity in arbitration decisions. Behavioral Science, 1978, 23, 446-
456. (34)
McClow, M.V., & W illiam s, A.C. Mammographie exam inations (4030): Ten-
year clinical experience in a community medical center. Annals of Surgery, 1973,
177, 616-619.(18)
M cGrath, P . . Radioactive waste management: Potentials and hazards from
a risk point of view (R eport EURFNR 1204 [KFK 1992]). K arlsruhe, W est
Germany: U.S.-EURATOM Fast Reactor Exchange Program m e, 1974. (33)
McNeil, B .J., W eichselbaum, R ., & Pauker, S.G. Fallacy of the five-year
survival in lung cancer. New England Journal of Medicine, 1978, 299, 1397-
1401. (33)
Meehl, P.E. Clinical versus statistical prediction: A theoretical analysis and a
review of the evidence. Minneapolis: U niversity of Minnesota Press, 1954. (28)
Meehl, P.E. W hen shall we use our heads instead of the form ula? Jo u rn al of
Counseling Psychology, 1957, 4, 268-273. (20)
Meehl, P,E. Seer over sign: The first good example. Jo u rn al of Experim ental
R esearch in Personality, 1965,1,27-32. (28)
Meehl, P.E. Nuisance variables and the ex post facto design. In M. R adner &
S. W inokur (Eds.), M innesota studies in the philosophy of science. Minneapolis:
U niver-sity of M innesota Press, 1970. (23)
M eehl, P .E ., & R osen, A. A n teced en t p ro b ab ility and th e efficacy of
psychom etric signs, p attern s or cuttin g scores. Psychological B ulletin, 1955,
52,194-216. (10)
M erton, R.K. The self-fulfilling prophecy. A ntioch Review, 1948, 8, 193-
210. (15)
M ervis, C.B., & Rosch, E. Categorization of n atu ral objects. A nnual Review
of Psychology, 1981, 32,89-115. (6)
M ichotte, A. The perception of causality. New York: Basic Books, 1963. (19)
M ilgram , S. Behavioral study of obedience. Jo u rn al of Abnormal and Social
Psychology, 1963, 67, 371-378. (7,9)
Mill, J.S . A system of logic, ratiocinative and inductive. Toronto: U niversity
of Toronto Press, 1974 (Originally published in 1843). (32)
M iller, A.G. The social psychology of psychological research. New York:
M acmillan, 1972.(9)
M iller, A.G ., Gillen, B., Schenker, C., & Radlove, S. Perception of obedience
to a u th o rity . Proceedings of the 8 1 st A nnual Convention of th e A m erican
Psychological A ssociation, 1973,8,127-128. (7)
M iller, D.T. W hat constitutes a self-serving attributional bias? Jo u rn al of
Литература 617
Personality and Social Psychology, 1978,36,1221-1223. (9)
M iller, D.T., & Ross, M. Self-serving biases in the attrib u tio n of causality:
Fact or fiction? Psychological Bulletin, 1975,82,213-225. (9)
Mischel, W . Personality and assessment. New York: W iley, 1968. (4,15)
Mischel, W . Continuity and change in personality. American Psychologist,
1969,24,1012-1018.(15)
Mischel, W. On the interface of cognition and personality: Beyond the person-
situation debate. American Psychologist, 1979,34, 740-754. (6)
M ischel, W ., & G illigan, C. Delay of g ra tifica tio n , m otiv atio n fo r th e
prohibited gratification, and responses to tem ptation. Jo u rn al of Personality
and Social Psychology, 1964, 64,411-417. (15)
Mitchell, T.R., & Kalb, L.S. Outcome knowledge and content as determ inants
of supervisor attributions and judgm ents of responsibility about a subordinate’s
poor perform ance, journal of Applied Psychology, in press. (31)
Moore, P.G. The m anager’s struggle w ith uncertainty. Jo u rn al of the Royal
S tatistical Society (Series A), 1977,140,129-165. (31)
M orris, P. A. Decision analysis expert use. M anagement Science, 1974, 20,
1233-1241.(31)
M orrison, R. J . Franklin D. Roosevelt and the Supreme Court: An example
of the use of probability theory in political history. H istory and Theory, 1977,
16,137-146.(23)
M orton, J . Interaction of inform ation in word recognition. Psychological
Review, 1969, 76,165-178. (35)
Moskowitz, H., & Bullers, W.I. Modified PERT versus fractile assessment of
subjective probability distributions (Paper No. 675). Purdue University, 1978. (22)
M urphy, A.H. Scalar and vector partitions of the probability score (P art I).
Two-state situation. Journal of Applied Meteorology, 1972,31,273-282. (22)
M urphy, A.H. A new vector partitio n of th e probability score. Jo u rn al of
Applied Meteorology, 1973,12, 595-600. (22)
M urphy, A.H. Personal com munication, A ugust 1980. (22)
M urphy, A .H ., & W inkler, R.L. Forecasters and probability forecasts: Some
current problems. Bulletin of the American Meteorological Society, 1971,52,239-
247. (22)
M urphy, A .H ., & W in k le r, R .L . S u b jectiv e p ro b a b ility fo re c a stin g
experiments in meteorology: Some prelim inary results. Bulletin of the American
Meteorological Society, 1974, 55,1206-1216. (22, 31)
M urphy, A .H ., & W inkler, R.L. Can w eather forecasters form ulate reliable
probability forecasts of p recipitation and tem p eratu re? N ational W eather
Digest, 1977, 2, 2-9. (22, 31) (a)
Murphy, А.И., & Winkler, R.L. The use of credible intervals in temperature
forecasting: Some experimental results. In H. Jungerm ann & G. deZeeuw (Eds.),
Decision making and change in human affairs. Amsterdam: D. Reidel, 1977. (22) (b)
N aatanen, R ., & Summala, H. Road-user behavior and traffic accidents.
A m sterdam : North-Holland, 1975. (33)
618 ЛИТЕРАТУРА
Nickerson, R .S., & McGoldrick, C.C., J r . Confidence ratin g s and level of
performanceona judgmental task. PerceptualMotorSkills, 1965,20,311-316(22,31)
N isbett, R.E., & Borgida, E. A ttribution and the psychology of prediction.
Journal of Personality and Social Psychology, 1975,32,932-943. (7 ,1 0 ,2 7 ,3 2 )
N isbett, R .E ., Borgida, E., Crandall, R ., & Reed, H. Popular induction:
Inform ation is not necessarily inform ative. In J . S. Carroll and J . W. Payne
(Eds.), Cognition and social behavior. Hillsdale, N .J.: Erlbaum , 1976. (19, 28)
N isbett, R .E., & Ross, L. H um an inference: Strategies and shortcomings of
social judgm ent. Englewood Cliffs, N .J.: Prentice-H all, 1980. (6 ,9 ,1 0 ,1 5 ,3 2 ,
34, 35)
N isbett, R .E., & Schächter, S. Cognitive m anipulations of pain. Jo u rn al of
Experi-m ental Social Psychology, 1966, 2, 227-236. (7)
N isbett, R .E ., & W ilson, T.D. Telling more than we can know: Verbal reports
on m ental processes. Psychological Review, 1977, 84, 231-259. (19, 32, 34)
N isbett, R .E., Zukier, H., &Lemley, R.E. The dilution effect: Nondiagnostic
inform ation weakens the im plications of diagnostic inform ation. Cognitive
Psychology, 1981,13, 248-277. (34)
N orm an, W .T ., & G oldberg, L.R. R a te rs, ra te e s, an d random ness in
personality stru ctu re. Journal of Personality and Social Psychology, 1966, 4,
681-691.(15)
Nowell-Smith, P. H. H istorical explanation. In H . E. K iefer &M. K. M unitz
(Eds.), Mind, science and history. Albany, N.Y.: State U niversity of New York
Press, 1970, (23)
O’Leary, M .K ., Coplin, W .D ., Shapiro, H .B ., & Dean, D. The qu est for
relevance. International Studies Q uarterly, 1974, IS, 211-237. (23)
Olson, C.. Some apparent violations of the representativeness heuristic in
hum an judgm ent. Journal of Experim ental Psychology: Human Perception and
Perform ance, 1976, 2, 599-608. (5, 34)
Om e, M.T. Demand characteristics and th e ir implications for real life: The
im portance of quasi-controls. In A.G. M iller (Ed.), The social psychology of
psychological research. New York: Macmillan, 1972. (9)
Om e, M.T. Communication by the total experim ental situation: W hy it is
im portant, how it is evaluated, and its significance fo r the ecological validity of
findings. In P. Pliner, L. Krames, & T. Alloway (Eds.), Communication and
affect. New York: Academic Press, 1973. (34)
Oskamp, S. The relationship of clinical experience and train in g methods to
several criteria of clinical prediction. Psychological Monographs, 1962,76, (28,
W hole No. 547). (20, 22, 31)
Overall, J.E . Classical statistical hypothesis testing w ithin the context of
Bayesian theory. Psychological Bulletin, 1969, 71, 285-292. (2)
Pardueci, A. Category judgm ent: A range-frequency model. Psychological
Review, 1965, 72, 407-418. (34)
P a ssin i, F .T ., & N orm an, W .T. A u n iv ersal conception of p erso n ality
stru ctu re? Jo u rn a l of Personality and Social Psychology, 1966,4, 44-49. (15)
Литература 619
P atterson, С.Н. Diagnostic accuracy o r diagnostic stereotypy? Jo u rn al of
Consulting Psychology, 1955,19,483-485. (20)
Payne, J.W . Inform ation processing theory: Some concepts and methods
applied to decision research. In T. W allsten (Ed.), Cognitive processes in choice
and decision behavior. Hillsdale, N .J.: Erlbaum , 1980. (19)
Pennington, D.C., R u tter, D .R., McKenna, K ., & Morley, I.E. Estim ating
the outcome of a pregnancy test: W omen’s judgm ents in foresight and hindsight.
B ritish Jo u rn al of Social and Clinical Psychology, 1980, 79, 317-323. (31)
P eterson, C.R. (Ed.). Special issue: Cascaded inference. O rganizational
Behavior and H um an Perform ance, 1973,10, 315-432. (27)
Peterson, C.R., & Beach, L.R. Man as an intuitive statistician. Psychological
B ulletin, 1967, 68(1), 29-46. (3 ,1 5 , 31)
Peterson, C.R., DuCharme, W .M ., & Edwards, W . Sampling distributions
and probability revisions. Journal of Experim ental Psychology, 1968, 76,236-
243. (3)
Peterson, C.R., Schneider, R. J ., & M iller, A. J . Sample size and the revision
of subjective probabilities. Journal of Experim ental Psychology, 1965,69,522-
527. (25)
P h illip s, L.D. Some com ponents of p ro b ab ilistic inference (Tech. Rep.
No. 1). H um an Perform ance Center, U niversity of Michigan, 1966. (11)
Phillips, L.D., & Edwards, W. Conservatism in simple probability inference
tasks. Journal of Experim ental Psychology, 1966, 72, 346-357. (25)
P h illip s, L.D ., H ays, W .L ., & E dw ards, W . C onservatism in com plex
probabilistic inference. IEEE Transactions on Human Factors in Electronics,
1966, HFE-7, 7-18.(25)
Phillips, L.D ., & W right, G.N. C ultural differences in viewing uncertainty
and assessing probabilities. In H. Jungerm ann & G. deZeeuw (Eds.), Decision
m aking and change in hum an affairs. A m sterdam : D. Reidel, 1977. (22, 31)
P ickhardt, R.C., & W allace, J.B . A study of the perform ance of subjective
probability assessors. Decision Sciences, 1974, 5, 347-363. (22, 31)
P itz , G .F. Subjective p ro b ab ility d istrib u tio n s fo r im perfectly know n
quantities. In L.W . Gregg (Ed.), Knowledge and cognition. New York: Wiley,
1974. (22, 31)
Pitz, G.F., Downing, L., & Reinhold, H. Sequential effects in the revision of
subjective probabilities. Canadian Journal of Psychology, 1967,21,381-393. (3)
Pokorny, G. Energy development: A ttitu d es and beliefs a t the regional/
national levels. Cambridge, Mass.: Cambridge R eports, 1977. (33)
Polefka, J . The perception and evaluation of responses to social influences.
Unpublished doctoral dissertation, Stanford U niversity, 1965. (9)
Pollack, L, & Decker, L.R. Confidence ratings, message receptions, and the
receiver operating characteristics. Journ al of the Acoustical Society of America,
1958, 30, 286-292. (22)
Posner, M.I. Chronometrie explorations of mind. Hillsdale, N .J.: Erlbaum ,
1978. (35)
620 ЛИТЕРАТУРА
Posner, МЛ., & Keele, S.W . On the genesis of ab stract ideas. Jo u rn al of
Experim ental Psychology, 1968, 77, 353-363. (6)
Poulton, E.C. The new psychophysics: Six models fo r m agnitude estim ation.
Psychological B ulletin, 1968, 69,1-19. (33)
Poulton, E.C. Range effects in experim ents w ith people. American Jo u rn al
of Psychology, 1975, 88, 3-32. (34)
P ra tt, J.W . Personal communication, October 1975. (22)
P re s id e n t’s Commission on the A ccident a t Three Mile Island. R eport.
W ashington, D.C.: U.S. Government P rin tin g Off ice, 1979. (33)
Prim ack, J . N uclear reactor safety: An introduction to the issues. Bulletin
of the Atomic Scientists, 1975,31,15-17. (33)
Pryor, J . B., & K riss, M. The cognitive dynamics of salience in the attribution
process. Jo u rn al of Personality and Social Psychology, 1977,35,49-55. (13)
R aiffa, H. R isk, am biguity and the Savage axioms: Comment. Q uarterly
Jo u rn a l of Economics, 1961, 75, 690-694. (35)
R aiffa, H. A ssessm ents of probabilities. Unpublished m anuscript, H arvard
U niver-sity, 1969. (22)
R ather, D., & Heskowitz, M. The camera never blinks. New York: B allantine
Books, 1977. (12)
Regan, D.T., & Totten, J . Em pathy and attribution: Turning observers into
actors. Jo u rn al of Personality and Social Psychology, 1975, 32,850-856. (9)
Rem us, W .E ., & Jenicke, L.O. U nit and random linear models in decision
m aking. M ultivariate Behavioral Research, 1978,13, 215-221. (28)
R ethans, A. A n investigation of consum er perceptions of product hazards.
Doctoral dissertation, U niversity of Oregon, 1979. (33)
Rhoads, J . E. Textbook of surgery. Philadelphia: Lippincott, 1969. (18)
Rogers, T.B., K uiper, N.A ., & K irker, W .S. Self-reference and the encoding
of personal inform ation. Jo u rn al of Personality and Social Psychology, 1977,
35, 677-688. (12)
Root, H. E. Probability statem ents in w eather forecasting. Journal of Applied
Meteorology, 1962,1,163-168. (22,31)
Rosato, F., Thomas, J ., & Rosato, E. Operative m anagem ent of nonpalpable
lesions detected by mammography. Surgery, Gynecology, and Obstetrics, 1973,
337, 491-493. (18)
Rosch, E. Cognitive reference points. Cognitive Psychology, 1975, 7, 532-
547. (6 ,8 )
Rosch, E. Principles of categorization. In E. Rosch and B.B. Floyd (Eds.),
Cognition and categorization. Hillsdale, N .J.: Erlbaum , 1978. (6)
Rosch, E ., & M ervis, C.B. Fam ily resemblances: Studies in th e in tern al
stru c tu re of categories. Cognitive Psychology, 1975, 7, 573-605. (6)
R osenberg, J . A q u estio n of ethics: The DNA co n tro v ersy . A m erican
Educator, 1978, 2, 27-30. (33)
Rosenhan, D.L. On being sane in insane places. Science, 1973,279,250-258. (15)
R o se n th a l, R ., & Jaco b so n , L. P ygm alio n in th e classroom : T eacher
Литература 621
expectation and pupils’ intellectual development. New York: Holt, R inehart &
W inston, 1968. (9,15)
Ross, L. The intuitive psychologist and his shortcomings: Distortions in the
attrib u tio n process. In L. Berkowitz (Ed.), Advances in experim ental social
psychol-ogy (Vol. 10). New York: Academic Press, 1977,174-177. (8 ,9 ,1 3 ,1 5 ,
19, 30, 32)
Ross, L. Some afterthoughts on the intuitivepsychologist. InL. Berkowitz (Ed.),
Cognitive theories in social psychology. New York: Academic Press, 1978. (15)
Ross, L., Amabile, T.M., & Steinmetz, J.L . Social roles, social control, and
biases in social p erception processes. J o u rn a l of P e rso n a lity and Social
Psychology, 1977, 35, 485-494. (9)
Ross, L., Bierbrauer, G., & Polly, S. A ttrib u tio n of educational outcomes by
professional and non-professional instructors. Journal of Personality and Social
Psychology, 1974, 29, 609-618. (9)
Ross, L., Greene, D., & House, P. The false consensus phenomenon: A n
attributional bias in self perception and social perception processes. Jo u rn al of
E x p erim en tal Social Psychology, 1977,13, 279-301. (9)
R oss, L., & L epper, M .R. The perseverance of beliefs: E m pirical and
n o rm a tiv e c o n sid e ra tio n s. In R .A . S hw eder (E d.), New d ire c tio n s fo r
methodology of behavioral sciences: Fallible judgm ent in behavioral research.
San Francisco: Jossey-Bass, 1980. (9, 34)
Ross, L., Lepper, M .R., & Hubbard, M. Perseverance in self perception and
social perception: Biased attributional processes in the debriefing paradigm.
Jo u rn al of Personality and Social Psychology, 1975, 32,880-892. (9,15)
Ross, L., Lepper, M .R., Strack, F., & Steinm etz, J.L . Social explanation and
social expectation: The effects of real and hypothetical explanations upon
subjective likelihood. Journal of Personality and Social Psychology, 1977, 35,
817-829.(9,15)
Ross, M., & Sicoly, F. Egocentric biases in availability and attrib u tio n .
Jo u rn al of Personality and Social Psychology, 1979, 37,322-336. (13)
R othbart, M., Fulero, S., Jensen, C., Howard, J . , & Birrell, P. From individual
to group impressions: A vailability heuristics in stereotype form ation. Journal
of Experim ental Social Psychology, 1978,14, 237-255. (13)
R othbart, M ., & Snyder, M. Confidence in the prediction and postdiction of an
uncertain event. Canadian Journal of Behavioral Science, 1970, 2, 38-43. (35)
R othschild, N. Coming to grip s w ith risk . A ddress p resen ted on BBC
television, November 1978. (R eprinted in the W all S treet Journal, May 13,
1979.) (33)
R um elhart, D. E. Schemata: The building blocks of cognition. In R. Spiro,
B. Bruce, and W . Brewer (Eds.), Theoretical issues in reading comprehension.
Hillsdale, N .J.: Erlbaum, 1979. (34)
Russell, B. Philosophy. New York: N orton, 1927. (7)
R usso, J .E . The value of u n it price inform ation. Jo u rn a l of M arketing
Research, 1977,11,193-201. (19)
622 ЛИТЕРАТУРА
Sanders, F. The evaluation of subjective probability forecasts (Scientific
R eport No. 5). Cambridge: M assachusetts In stitu te of Technology, D epartm ent
of Meteorology, 1958. (22)
Savage, L .J. The foundations of statistics. New York: W iley, 1954. (1, 25)
Savage, L .J. E licitation of personal probabilities and expectations. Jo u rn al
of the A m erican Statistical Association, 1971, 66, 336, 783-801. (22)
Sawyer, J. M easurement and prediction, clinical and statistical. Psychological
B ulletin, 1966,66,178-200. (28)
Schächter, S., & Singer, J.E . Cognitive, social, and physiological determ inants
of emotional state. Psychological Review, 1962,69,379-399. (7)
Schaefer, R .E., & Borcherding, K. The assessment of subjective probability
distri-bution: A training experim ent. A cta Psychologica, 1973, 37, 117-129.
(22, 31)
Schm idt, F. L. The relative efficiency of regression and simple u n it predictor
w eights in applied d ifferen tial psychology. Educational and Psychological
M easure-ment, 1971, 31, 669-714. (28)
Schoemaker, P. J.H ., & K unreuther, H.C. An experimental study of insurance
decisions. Jo u rn al of Risk and Insurance, 1979,46, 603-618. (33)
Schum , D. C u rre n t developm ents in re sea rc h and cascaded in feren ce
processes. In T. W allsten (Ed.), Cognitive processes in choice and decision
behavior. Hillsdale, N .J.: Erlbaum , 1980. (19)
Seaver, D.A., von W in terfeld t, D., & Edw ards, W. E liciting subjective
probability distributions on continuous variables. Organizational Behavior and
H um an Perfor-m ance, 1978, 21, 379-391. (22,31)
Selvidge, J . Experim ental comparison of different methods for assessing the
extrem es of probability distributions by the fractile m ethod. (M anagement
Science R eport Series, Report 75-13). Boulder, Colo. Graduate School of Business
A dm inistration, U niversity of Colorado, 1975. (22)
Selvidge, J . Assessing the extremes of probability distributions by the fractile
m ethod. Decision Sciences, 1980, II, 493-502. (31)
Shafer, G. A m athem atical theory of evidence. Princeton, N. J . : Princeton
U niversity Press, 1976. (6, 35)
Shapiro, S ., Strax, P ., & Venet, L. Periodic breast cancer screening. Archives
of Environm ental H ealth, 1967,15, 547-553. (18)
Shapiro, S., S trax , P ., & Venet, L. Periodic b re a st cancer screening in
re d u c in g m o rta lity fro m b re a s t c an c e r. J o u rn a l of A m erican M edical
A ssociation, 1971, 215,1777-1785. (18)
Sheridan, T.B. H um an e rro r in nuclear power plants. Technology Review,
F ebruary 1980, 23-33. (33)
Shweder, R. A. (Ed.), New directions for methodology of behavioral sciences:
Fallible judgm ent in behavioral research. San Francisco: Jossey-Bass, 1980. (34)
Shweder, R. A ., & D’A ndrade, R.G. The systematic distortion hypothesis. In
R.A. Shweder (Ed.), Fallible judgm ent in behavioral research. San Francisco:
Jossey-Bass, 1980. (6)
Литература 623
Sieber, J.E . Effects of decision importance on ability to generate w arranted
subjective uncertainty. Journal of Personality and Social Psychology, 1974,30,
688-694. (22,31)
Siegel, S. Nonparam etric statistics for the behavioral sciences. New York:
McGraw-Hill, 1956. (5)
Siegler, R.S. The origins of scientific reasoning. In R.S. Siegler (Ed.),
Children’s thinking: W hat develops? H ilJsdale, N .J.: Erlbaum , 1979. (19)
S ilv erm an , I. M otives u n d e rly in g th e b eh av io r of th e su b ject in th e
psychological experim ent. Paper presented a t the m eeting of the American
Psychological Association, Chicago, September 1965. (9)
Simon, H. Models of man: Social and rational. New York: W iley, 1957. (13)
Simon, H.A. Information-processing theory of hum an problem solving. In
W. K. Estes (Ed.), Handbook of learning and cognitive processes (Vol. 5).
Hillsdale, N .J.: Erlbaum, 1978.
(19) Simon, H.A ., & Chase, W.G. Skill in chess. Am erican Scientist, 1973,
63, 394-403. (28)
Simon, H. A ., & Hayes, J. R. The understanding process: Problem isomorphs.
Cognitive Psychology, 1976, 8,165-190. (19)
Simon, H. A ., & Newell, A. Human problem solving: The state of the theory'
in 1970. American Psychologist, 1971, 26,145-159. (19)
Slovic, P. Cue consistency and cue utilization in judgm ent. American Journal
of Psychology, 1966, 79, 427-434. (4)
Slovic, P. From Shakespeare to Simon: Speculations - and some evidence - about
m an’s ability to process information. Oregon Research Institute Research Bulletin,
1972,12(2). Available from Decision Research, Eugene, Oregon (8,22) (a)
Slovic, P. Lim itations of the m ind of man: Implications for decision making
in the nuclear age. In H. J . Otway (Ed.), Risk vs. benefit: Solution or dream?
(Report LA 4860-MS). Los Alamos, N.M.: Los Alamos Scientific Laboratory,
1972. (Available from the N ational Technical Inform ation Service). (28) (b)
Slovic, P. Psychological study of hum an judgment: Implications for investment
decisionmaking. Journal of Finance, 1972, 27, 779-799. (31, 33) (c)
Slovic, P. Hypothesis testing in the learning of positive and negative linear
functions. O rganizational Behavior and Human Perform ance, 1974, H, 368-
376. (23)
Slovic, P ., & Fischhoff, В. On the psychology of experim ental surprises.
Jo u rn al of Experim ental Psychology: H um an Perception and Perform ance,
1977,3,544-551.(23,31)
Slovic, P ., Fischhoff, В ., & Lichtenstein, S. Cognitive processes and societal
risk taking. In J.S . Carroll & J . W . Payne (Eds.), Cognition and social behavior.
Hillsdale, N .J.: Erlbaum, 1976. (6,19, 23)
Slovic, P ., Fischhoff, В., & Lichtenstein, S. Behavioral decision theory.
A nnual Review of Psychology, 1977, 28,1-39. (8 ,1 9 , 34, 35)
Slovic, P ., Fischhoff, В., & Lichtenstein, S. Accident probabilities and seat
624 ЛИТЕРАТУРА
belt usage: A psychological perspective. Accident A nalysis and Prevention,
1978, W , 281-285. (33)
Slovic, P ., Fischhoff, В., & Lichtenstein, S. R ating the risks. Environm ent,
1979, 21(3), 14-20, 36-39. (33)
Slovic, P., Fischhoff, В. & Lichtenstein, S. Facts vs. fears: U nderstanding
perceived ris k . In R. Schw ing & W . A. A lbers, J r . (Eds.), Societal risk
assessment: How safe is safe enough? New York: Plenum, 1980. (33)
Slovic, P ., Fischhoff, В., & Lichtenstein, S. Characterizing perceived risk.
In R.W . K ates & C. Hohenemser (Eds.), Technological hazard management.
Cambridge, M ass.: Oelgeschlager, Gunn and Hain, in press. (33) (a)
Slovic, P ., Fischhoff, В., & Lichtenstein, S. Response mode, fram ing, and
informa-tion processing effects in risk assessment. In R. M. Hogarth (Ed.), New
directions for methodology of social and behavioral science: The framing of questions
and the consistency of response. San Francisco: Jossey-Bass, in press. (33) (b)
Slovic, P ., F ischhoff, В., L ichtenstein , S., C orrigan, B., & Combs, B.
Preference for insuring against probable small losses: Insurance implications.
Jo u rn al of Risk and Insurance, 1977,44, 237-258. (33)
Slovic, P ., K unreuther, H., & W hite, G. F. Decision processes, rationality,
and adjustm ent to n atural hazards. InG . F. W hite (Ed.), N atural hazards: Local,
national, and global. New York: Oxford U niversity Press, 1974. (33)
Slovic, P ., & L ich ten stein , S. C om parison of B ayesian and reg ressio n
approaches to the study of inform ation processing in judgm ent. O rganizational
Behavior and H um an Perform ance, 1971,6, 649-744. (1, 3 ,4 ,2 3 , 28)
Slovic, P ., Lichtenstein, S., & Fischhoff, В. Images of disaster: Perception
and acceptance of risks from nuclear power. In G. T. Goodman & W. D. Rowe
(Eds.), Energy risk management. London: Academic Press, 1979. (33)
Slovic, P., & Tversky, A. W ho accepts Savage’s axiom? Behavioral Science,
1974,19, 368-373. (34)
Smedslund, J . The concept of correlation in adults. Scandinavian Jo u rn al of
Psychology, 1963, 4,165-173. (15,19)
Sm edslund, J . N ote on learning, contingency, and clinical experience.
Scandinavian Jo u rn al of Psychology, 1966, 7, 265-266. (11,19)
Sm ith, E.E., Shoben, E .J., & Rips, L .J. S tructure and process in semantic
memory: A featural model for semantic decisions. Psychological Review, 1974,
81,214-241.(6)
Snapper, K. J ., & Fryback, D.G. Inference based on unreliable reports. Journal
of Experim ental Psychology, 1974, 87, 401-404. (26)
Snyder, M., & Swann, W .B .,Jr. W hen actions reflect attitudes: The politics
of impression management. Journal of Personality and Social Psychology, 1976,
34,1034-1042.(15)
Snyder, M ., & Swann, W .B .,J r . Behavioral confirmation in social interaction:
From social perception to social reality. Jo u rn al of Experim ental Psychology,
1978,14,148-162. (9) (a)
Snyder, M., & Sw ann, W .B .,J r. H ypothesis-testing processes in social
Литература 625
interaction. Journal of Personality and Social Psychology, 1978,36,1202-1212.
(9)(b)
Snyder, M., Tanke, E. D., & Berscheid, E. Social perception and interpersonal
behavior: On th e self-fu lfillin g n a tu re of social stereo ty p es. J o u rn a l of
Personality and Social Psychology, 1977, 35,656-666. (9,15)
S n y d e r, R .E . M am m ography: C o n trib u tio n s an d lim ita tio n s in th e
m anagem ent of cancer of the breast. Clinical O bstetrics and Gynecology, 1966,
9, 207-220. (18)
Sokolov, E.N. The modeling properties of the nervous system. In I. Maltzman
and K. Cole (Eds.), Handbook of Contemporary Soviet Psychology, New York:
Basic Books, 1969. (35)
Soskin, W. F. Bias in postdiction from projective tests. Jo u rn al of Abnormal
and Social Psychology, 1954, 49, 69-74. (20)
Sowby, F.D. Radiation and other risks. Health Physics, 1965,11,879-887. (33)
Srinivisan, V. A theoretical comparison of the predictive power of the multiple
regression and equal weighting procedures (Research Paper No. 347), Stanford,
Calif.: Stanford U niversity, G raduate School of Business, 1977. (28)
Staddon, J .E .R ., & Sim melhag, V.L. The “su p erstitio n ” experim ent: A
reexam ination of its im plications fo r the principles of adaptive behavior.
Psychological Review, 1971, 78, 3-43. (19)
S tael von H o lstein , C .-A .S. A n e x p e rim e n t in p ro b a b ilistic w e ath e r
forecasting. Journal of Applied Meteorology, 1971,10,635-645. (22, 31) (a)
Stael von H olstein, C.-A.S. Two techniques fo r assessm ent of subjective
probabil-ity distributions-A n experim ental study. ActaPsychologica, 1971,35,
478-494. (l)(b )
Stael von Holstein, C. -A. S. Probabilistic forecasting: An experim ent related
to the stock m arket. Organizational Behavior and H um an Perform ance, 1972,
8,139-158.(31)
S ta rr, B .J., & K atkin, E.S. The clinician as an aberrant actuary: Illusory
correlation and the incomplete sentence blank. Journal of Abnormal Psychology,
1969, 74, 670-675.(15)
S tarr, C, & W hipple, C. Risks of risk decisions. Science, 1980, 208, 1114-
1119.(33)
Steinbrugge, K.V., McClure, F.E., & Snow, A .J. Studies in seismicity and
e a rth q u a k e dam ag e s ta tis tic s (R e p o rt [A p p en d ix A] C O M -71-00053).
W ashington, D.C.: U.S. D epartm ent of Commerce, 1969. (33)
Stevens, S.S., & G reenbaum , H.B. R egression effect in psychophysical
judgm ent. Perception and Psychophysics, 1966,1,439-446. (4)
Storm s, M.D. Videotape and the a ttrib u tio n process: Reversing actors’ and
observers’ points of view. Journal of Personality and Social Psychology, 1973,
27,165-175, (9,12)
Storms, M.D., & N isbett, R.E. Insomnia and the attribution process. Journal
of Personality and Social Psychology, 1970,16, 319-328. (7)
Strachey, L. Em inent Victorians. New York: Putnam , 1918. (23)
626 ЛИТЕРАТУРА
Strickland, L.H. Surveillance and tru st, Jo u rn al of Personality, 1958, 26,
200-215. (9)
Strickland, L.H., Lewicki, R .J., & K atz, A.M. Temporal orientation and
perceived control as determ inants of risk-taking. Journal of Experimental Social
Psychology, 1966,2,143-151. (16)
Svenson, O. A re we all less risky and more skillful th an our fellow drivers?
A cta Psychologica, 1981,47,143-148. (33)
Sw ets, J .A ., T a n n e r, W .P .,J r ., & B ird sall, T. D ecision processes in
perception. Psychological Review, 1961, 68, 301-340. (22)
Taft, R. The ability to judge people. Psychological Bulletin, 1955,52,1-23. (20)
Tawney, R.H. The agrarian problems in the sixteenth century. New York:
Franklin, 1961. (23)
Taylor, H.C, & Russell, J.T . The relationship of validity coefficients to the
practical effectiveness of tests in selection: Discussion and tables. Jo u rn al of
Applied Psychology, 1939, 23, 565-578, (19)
Taylor, S.E., & Crocker, J . The processing of context inform ation in person
perception. Unpublished m anuscript, H arvard U niversity, 1979. (34) (a)
Taylor, S.E., & Crocker, J. Schematic bases of social information processing. In
E.T. H iggins, P. Herm an, & M.P. Zanna (Eds.), The O ntario Symposium on
Personality and Social Psychology (Vol. 1). Hillsdale, N .J.: Erlbaum, 1979. (13)(b)
Taylor, S.E., & Fiske, S.T. Point of view and perceptions of causality. Journal
of Personality and Social Psychology, 1975,32,439-445. (9,12,13)
Taylor, S.E., & Fiske, S.T. Salience, attention, and attribution: Top of the
head phenom ena. In L. Berkow itz (Ed.), A dvances in experim ental social
psychology (Vol. 11). New York: Academic Press, 1978. (9)
Taylor, S.E., Fiske, S.T., Close, M., Anderson, D., & Ruderman, A. Solo status
as a psychological variable: The pow er of being d istin ctiv e. U npublished
m anuscript, H arvard U niversity, 1976. (9,13)
Taylor, S.E., Fiske, S.T., Etcoff, N ., & Ruderm an, A. The categorical and
contextual bases of person memory and stereotyping. Jo u rn al of Personality
and Social Psychology, 1978,36, 778-793. (13)
Taynor, J . , & Deaux, K. W hen women are more deserving th a n men: Equity,
a ttrib u tio n , and perceived sex differences. Jo u rn al of Personality and Social
Psychol-ogy, 1973, 28,360-367. (15)
Testa, T. J . Causal relationships and the acquisition of avoidance responses.
Psychological Review, 1974,81,491-505. (15)
Thibaut, J . W ., & Riecken, H.W . Some determ inants and consequences of the
perception of social causality. Journal of Personality, 1955,24,113-133. (9)
T h o rn to n , B. L in ea r p re d ic tio n of m a rita l h ap p in ess: A re p lic a tio n .
Personality and Social Psychology Bulletin, 1977, 3,674-676. (28) (a)
Thornton, B. Personal communication, 1977. (28) (b)
T ufte, E. R ., & Sun, R.A. A re there bellwether electoral districts? Public
Opinion Q uarterly, 1975, 39,1-18. (23)
Литература 627
Tukey, J . W . Some th o u g h ts on clinical tria ls, especially problem s of
m ultiplicity. Science, 1977,198, 679-690. (23)
Tulving, E ., & Pearlstone, Z. Availability versus accessibility of inform ation
in memory fo r words. Journal of Verbal Learning and Verbal Behavior, 1966,5,
381-391.(11)
Tune, G.S. Response preferences: A review of some relevant literatu re.
Psychological Bulletin, 1964, 61, 286-302. (2, 3)
T uroff, M. A n alternative approach to cross-impact analysis. Technological
Forecast-ing and Social Change, 1972, 3,309-339. (8)
Tversky, A. Intransitivity of preferences. Psychological Review, 1969, 76,
31-48.(19)
Tversky, A. Features of sim ilarity. Psychological Review, 1977, 84, 327-
352.(6, 8)
Tversky, A ., & K ahneman, D. The belief in the “law of small num bers.”
Psychologi-cal Bulletin, 1971, 76,105-110. (1, 3, 4, 6, 7, 23,34)
Tversky, A ., & Kahneman, D. Availability: A heuristic for judging frequency
and probability. Cognitive Psychology, 1973,5,207-232. (1 ,4 ,9 ,1 2 ,1 3 ,1 4 ,2 3 ,
30, 33)
Tversky, A ., & Kahneman, D. Judgm ent under uncertainty: Heuristics and
biases. Science, 1974,185,1124-1131. (6 ,8 ,1 3 ,1 9 ,2 2 ,2 7 ,2 8 ,3 0 ,3 1 ,3 3 ,3 4 ,3 5 )
T v ersk y , A ., & K ah n em an , D. C ausal schem as in ju d g m e n ts u n d e r
uncertainty. InM . Fishbein(Ed.), Progress in social psychology. Hillsdale, N .J.:
Erlbaum , 1980. (6 ,1 0 ,1 9 , 30)
Tversky, A ., & Kahneman, D. The fram ing of decisions and the rationality
of choice. Science, 1981, 211, 453-458. (33, 34)
U.S. House of Representatives. Browns Ferry nuclear plant fire: Hearing.
94th Congress, IstSession. W ashington, D.C.: U.S. Government P rinting Office,
September 16,1975. (33)
U.S. N uclear R egulatory Commission. Reactor safety study: An assessment
of accident risk s in U.S. com m ercial n u clear pow er p lan ts (WASH 1400
[NUREG-75/014]). W ashington, D.C.: NRC, 1975. (22, 23, 33)
U.S. N uclear Regulatory Commission. Risk assessment review group report
to the U.S. N uclear Regulatory Commission (NUREG/CR-0400). W ashington,
D.C.: NRC, 1978. (33)
U.S. W eather Bureau. Report on w eather bureau forecast performance 1967-
8 and comparison w ith previous years (Tech. M emorandum WBTM FCST, 11),
Silver Spring, M d.: Office of Meteorological Operations, W eather Analysis and
Predic-tion Division, M arch 1969. (22)
V alins, S. P e rs is te n t effects of in fo rm atio n about in te rn a l reactions:
Ineffectiveness of debriefing. In H. London & R.E. N isbett (Eds.), Thought and
feeling: Cognitive modification of feeling states. Chicago: Aldine, 1974. (9)
Vitz, P.C ., & Todd, D.C. A coded element model of the perceptual processing
of sequential stim uli. Psychological Review, 1969, 76,433-449. (3)
Von W interfeldt, D., & Edwards, W . F lat m axim a in linear optim ization
628 ЛИТЕРАТУРА
m odels (Tech. R ep. 011313-4-T ). A nn A rb o r: U n iv e rsity o f M ichigan,
Engineering Psychology Laboratory, 1973. (22,28)
W ag en aar, W .A . Subjective random ness and th e capacity to g en erate
inform ation. In A .F. Sanders (Ed.), A tten tio n and Perform ance, III, A cta
Psychologica, 1970, 33, 233-242. (3)
W ainer, H. E stim atin g coefficients in lin ear models: It d on’t m ake no
neverm ind. Psychological Bulletin, 1976,83, 312-317. (28)
W ainer, H ., & Thissen, D. Three steps toward robust regression. Psychometrika,
1976,41,9-34. (28)
W allace, H.A. W h at is the com judge’s mind? Jo u rn al of the A m erican
Society of Agronomy, 1923,15, 300-304. (28)
W allach, M.A., & W ing, C.W. Is risk a value? Jo u rn al of Personality and
Social Psychology, 1968,9,101-106. (16)
W allis, W .A ., & R oberts, H.V. Statistics: A new approach. New York: Free
Press, 1956. (4)
W allsten, T. Processes and models to describe choice and inference. In T.
W allsten (Ed.), Cognitive processes in choice and behavior. Hillsdale, N .J.:
Erlbaum , 1980. (19)
W a tlste n , T .S., & B udescu, D.F. Encoding subjective probabilities: A
psychological and psychometric review. Research Triangle Park, N.C.: U.S.
Environm ental Protection Agency, Strategies and A ir Standards Division, 1980.
(31) W alster, E., Berscheid, E., Abraham s, D., & Aronson, E. Effectiveness of
debriefing following deception experim ents. Jo u rn al of Personality and Social
Psychology, 1967, 6, 371-380. (9)
W ard, W.C, & Jenkins, H.M. The display of inform ation and the judgm ent of
contingency. Canadian Journal of Psychology, 1965,39,231-241. (1 1,15,19)
W arren, R.M. Perceptual restoration of m issing speech sounds. Science,
1970,167, 393-395. (35)
W ason, P.C. On the failure to elim inate hypotheses in a conceptual task.
Q uarterly Jo u rn al of Experim ental Psychology, 1960,12,129-140. (19)
W ason, P.C. R easoning. In B. Foss (Ed.), New horizons in psychology.
Middlesex, England: Penguin, 1966. (34)
W ason, P.C. Regression in reasoning? B ritish Jo u rn al of Psychology, 1969,
60,471-480. (34)
W ason, P.C., & Evans, J.St.B .T . Dual processes in reasoning? Cognition,
1975,3,141-154. (34)
W ason, P .C ., & Johnson-L aird, P .N . A co n flict betw een selecting and
evaluating inform ation in an inferential task. B ritish Jo u rn al of Psychology,
1970, 61,509-515.(34)
W ason, P.C., & Johnson-Laird, P.N . Psychology of reasoning: S tru ctu re and
Content. London: B atsford, 1972. (6 ,9 )
W ason P.C., & Shapiro, D. N atural and contrived experience in a reasoning
problem. Q uarterly Jo u rn al of Experim ental Psychology, 1971,23,63-71.(34)
W eatherw ax, R.K. V irtues and lim itations of risk analysis. Bulletin of the
Литература 629
Atomic Scientists, 1975, 33,29-32. (22)
W einer, В. Achievement m otivation and attrib u tio n theory. M orristown,
N .J.: General Learning Press, 1974. (9,15)
W einer, B., Frieze, I., K ukla, A ., Reed, L., R est, S., & Rosenbaum, R.
Perceiving the causes of success and failure. Morristown, N. J . : General Learning
Press, 1971.(7)
W einstein, N.D. Unrealistic optimism about fu tu re life events. Jo u rn al of
Personality and Social Psychology, 1980, 39, 806-820. (33)
W ells, G .L., & Harvey, J.H . Do people use consensus inform ation in making
causal attributions? Journal of Personality and Social Psychology, 1977, 35,
279-293. (10)
W ells, G .L., & Harvey, J.H . Naive attrib u to rs’ attributions and predictions:
W h at is inform ative and when is an effect an effect? Jo u rn al of Personality and
Social Psychology, 1978, 36, 483-490. (10)
W essm an, A .E ., & Ricks, D.F. Mood and personality. New York: Holt,
R inehart & W inston, 1966. (7)
Wheeler, G., &Beach, L.R. Subjective sampling distributions and conservatism.
Organizational Behavior and Human Performance, 1968,3,36-46. (3)
W heeler, W .M. An analysis of Rorschach indices of male homosexuality.
Rorschach Research Exchange, 1949,13,97-126. (17)
W hite, R. W . Lives in progress: A study of the n atu ral grow th of personality.
New York: Dryden Press, 1952. (20)
W h ite , R .W . M o tiv a tio n re c o n sid e re d : The co n cep t of com petence.
Psychological Review, 1959, 66, 297-333. (12,16)
W iddund, R.A. Objective self-awareness. In L. Berkowitz (Ed.), Advances
in experim ental social psychology (Vol. 9). New York: Academic Press, 1975.
(9)
W iggins, N ., & Kohen, E.S. Man vs. model of man revisited: The forecasting
of graduate school success. Journal of Personality and Social Psychology, 1971,
19,100-106. (28)
W ilks, S.S. W eighting systems for linear functions of correlated variables
when there is no dependent variable. Psychom etrika, 1938, 8, 23-40. (23, 28)
W illiams, P. The use of confidence factors in forecasting. Bulletin of the
A m erican Meteorological Society, 1951, 32, 279-281. (22)
W ilson, R. Analyzing the daily risks of life. Technology Review, 1979, 81,
40-46. (33)
W inch, R .F ., & More, D.M. Does TAT add in fo rm atio n to interview s?
S tatistical analysis of the increm ent. Journal of Clinical Psychology, 1956,12,
316-321. (20)
W inkler, R.L. The assessment of prior distributions in Bayesian analysis.
Jo u rn al of the American Statistical Association, 1967, 62, 776-800. (31)
W inkler, R .L ., & M urphy, A .H . E valuation of subjective precipitation
probability forecasts. In Proceedings of th e F irst N ational Conference on
S ta tis tic a l M eteorology, H a rtfo rd , Conn., May 27-29. Boston: A m erican
Meteorological Society, 1968. (22) (a)
W inkler, R .L., & M urphy, A.H. “Good” probability assessors. Jo u rn al of
Applied Meteorology, 1968, 7, 751-758. (22) (b)
W o h lste tte r, R. P earl H arbor: W arning and decision. S tanford, Calif.:
Stanford U niversity Press, 1962. (23, 31)
W olfe, J .N . M am m ography: R eport on its use in women w ith b reasts
abnormal and norm al on physical exam ination. Radiology, 1964, 83, 244-254.
(18)
W olfe, J.N . Mammography: Errors in diagnosis. Radiology, 1966,87,214-
219.
W olfe, J.N . M ammography (2nd ed.). Springfield, 111.: Charles C Thomas,
1967.(18)
W olosin, R .J ., S herm an, S .J ., & T ill, A. E ffe cts of co o p eratio n and
com petition on responsibility attrib u tio n a fte r success and failure, journal of
Experim ental Social Psychology, 1973,9, 220-235. (9)
Wood, G. The knew-it-all-along effect. Jo u rn al of Experim ental Psychology:
H um an Perception and Perform ance, 1978,4,345-353. (31)
W oodworth, R.S. Experim ental psychology. New York: Holt, 1938. (4)
W rig h t, G.N ., & Phillips, L.D. Personality and probabilistic thinking: An
experim ental study (Tech. Rep. 76-3). Uxbridge, England: Brunei In stitu te of
O rganisational and Social Studies, 1976. (22)
W right, G.N., Phillips, L.D., W halley, P.C., Choo, G.T.G., Ng, K.O., Tan,
I., & W isudha, A. C ultural differences in probabilistic thinking. Jo u rn al of
Cross-cultural Psychology, 1978,9, 285-299. (22)
W right, G .N ., & W isudha, A. Differences in calibration for past and fu tu re
e v en ts. P a p e r p re se n te d a t th e 7 th R esearch C onference on S u b jectiv e
Probability, U tility and Decision-Making, Goteborg, Sweden, A ugust 1979. (22)
Yarrow, M., Campbell, J.D ., & B urton, R.V. Recollections of childhood: A
study of the retrospective method. Monographs of the Society for Research in
Child Development, 1970, 35(5). (23)
Y ntem a, D.B., & Torgerson, W .S. M an-computer cooperation in decisions
requir-ing common sense. IRE Transactions of the Professional Group on Human
Factors in Electronics, 1961,2(1), 20-26. (28)
Zadeh, L.A. Fuzzy sets as a basis for a theory of possibility. Fuzzy Set and
Systems 1 ,1978,3-28. (6)
Институт прикладной психологии
Гуманитарный Центр

спецфакультет
«Организационная психология»
Гуманитарны й Ц ентр проводит очередной прием
слуш ателей на спецфакультет. А кадемическая пере­
подготовка специалистов с высш им образованием для
профессиональной работы по управлению организаци­
ей, взаимодействию с клиентам и, менеджменту пер­
сонала, рекламе и связям с общественностью.

Основная направленность специальных курсов:


-Организационная психология
-Управление персоналом
-Психология рекламы и поведения потребителей
-Политическая психология

Обучение заочное и платное (2 года, 6 сессий, 1162


учебных часа). Программа включает практическую и
тренинговую подготовку. Зачисление проводится по ре­
зультатам собеседования. Занятия начинаются с первой
декады октября текущего года. Выпускники защ ищ а­
ют дипломную работу и получают свидетельство об окон­
чании государственного образца (Свидетельство ДК№
2009 Министерства образования Украины от 10 ноября
2004г.).
З а н я т и я п роводят сп ец и ал и сты Г ум анитарного
Ц ентра совместно с ведущ ими учеными Санкт-П етер­
бургского Государственного Университета (факультет
психологии).
Дополнительная информация Украина, Харьков,
тел. (057)714-22-51, 719 59 29
e-mail: huce@ kharkov.ua
Даниель Канеман
Пауль Словик
Амос Тверски

Принятие решений
в неопределенности
Правила и предубеждения

Judgment under Uncertainty:


Heuristics and biases

Научный редактор: Г. В .С ухо дол ьски й


Редактор: С . Г. Т а р а со в
Литературный редактор: В . В. А р т ем ен к о
Компьютерная верстка: Д . В. К о зл о в

Свидетельство ДК № 2009 от 10.11.2004 г.

Издательство Институт прикладной


психологии “Гуманитарный Центр”.
61166, Украина, Харьков,
отдел продаж (057) 719-52-40, e-mail: huce@kharkov.ua
Подписано в печать 23. 12. 2004.
Формат 7 0 x 1 0 0 /1 6 . Бумага оф.
Уел. печ. л. 39,5 Тираж 1500 экз. Заказ №^jrQ
Отпечатано в типографии ГП ХМЗ ФЭД. Украина,
Харьков, ул. Сумская,132 тел. (057) 719-67-82

Вам также может понравиться