Глава 6. Мышление как проверка гипотез

Предположим, что верно следующее утверждение: у вас сильная зависимость от героина и вам надо выбрать одну из двух программ лечения.

Программа 1. Эту программу предлагают бывшие наркоманы. Вас будет лечить избавившийся от героиновой зависимости человек одного с вами возраста. В брошюре об этой программе сказано, что среди тех, кто занимается по ней не менее одного года, уровень успешности лечения очень высок (80 %). Одним из главных преимуществ этой программы является знание врача о том, что такое серьезное пристрастие к наркотикам, и возможность поделиться с вами опытом собственного выздоровления.

Программа 2. Врачи, которые предлагают эту программу, изучили психологические и биологические причины возникновения героиновой зависимости. По сравнению с программой 1 они обещают значительно более низкий уровень успешности лечения (30 %), но эта цифра получена на основе данных обо всех, кто лечился по этой программе. Ваш врач сам никогда не употреблял героин, зато исследовал различные варианты лечения. Вам надо принять важное решение. Какую из программ вы выберете?

Что такое проверка гипотезы

Исследование — это интеллектуальный подход к нерешенной проблеме, и его функция заключается в том, чтобы найти истину.

Лиди (Leedy, 1981, р. 7)

Наше мышление во многом напоминает научный метод проверки гипотез. Гипотеза — это набор предположений о природе мироздания; обычно это предположения о связи между двумя или несколькими переменными. Чтобы понять окружающий нас мир, мы накапливаем наблюдения, формируем предположения (или гипотезы), а затем методом наблюдения проверяем, подтверждаются они или нет. Таким образом, проверка гипотез — это один из способов выяснения истины о мире. Когда ученые хотят понять сущность событий, которые изучает их область науки, они пользуются тем же методом формулирования гипотез и проведения систематических наблюдений, которые могли бы подтвердить или опровергнуть эти гипотезы. Поэтому такой способ мышления имеет много общего с экспериментальными методами, используемыми в науке.

Объяснение, прогнозирование и контроль

Все люди… обладают природной любознательностью.

Аристотель (цит. по: J. Bartlett, 1992, р. 77)

У человека существует глубинная потребность понимать происходящие вокруг события. Сколько раз вы задавали себе вопросы типа «Почему мои друзья развелись — ведь казалось, что они прекрасно подходят друг для друга?» или «Как нам понять, почему сын министра здравоохранения, главного врача страны, пристрастился к наркотикам?». Когда вы пытаетесь ответить на подобные вопросы, вы, как и все мы, часто действуете, как «интуитивный ученый». Подобно ученым, мы строим собственные теории, объясняющие причины общественных событий или природных явлений. Важно уметь объяснить, почему люди реагируют на события определенным образом (например, «Он расист». «Она устала на работе и раздражена»), предсказывать результаты своих действий (например, «Если я не буду заниматься, я провалюсь на экзамене». «Если я буду носить одежду от кутюрье, все будут думать, что я крутой»), и управлять некоторыми из происходящих вокруг нас событий (например, «Чтобы получить хорошую работу в области бизнеса, мне надо получше изучить бухгалтерию»).

Цель проверки гипотез заключается в том, чтобы точно предсказать события, происходящие в той части мира, с которой мы соприкасаемся (Holland, Thagard, 1986). Чтобы выжить и действовать с максимальной эффективностью, мы должны уменьшить степень неопределенности в окружающей среде. Один из способов уменьшения неопределенности — это наблюдение за последовательностью событий с целью определения связей между ними, которые можно было бы использовать для прогнозирования. Например, ребенок может узнать, что всякий раз, когда он плачет, приходят взрослые; ваша собака может понять, что когда она встанет у кухонной двери, вы выпустите ее на улицу; подросток может выяснить, что родители сердятся, когда он поздно возвращается домой. Все эти связи важны для прогнозирования, поскольку они снижают степень неопределенности окружающей среды и позволяют нам в какой-то степени управлять своей жизнью. При определении этих связей мы пользуемся тем же процессом, с помощью которого врачи-исследователи открыли, что после применения химиотерапии у больных раком начинается ремиссия или что долгожительство связано с определенным образом жизни. Поскольку используется один и тот же процесс, некоторые из технических подходов, используемых в научных методах, применимы к практическому повседневному мышлению.

Индуктивные и дедуктивные методы

Индуктивные рассуждения являются одним из главных аспектов когнитивного развития и играют важную роль как в развитии системы процессов логического мышления, так и в приобретении новой информации.

Пеллегрино и Голдман (Pellegnno Goldman, 1983, р. 143)

Иногда индуктивные и дедуктивные методы проверки гипотез разграничивают (см. главу 4). При использовании индуктивного метода вы наблюдаете события, а затем строите гипотезу об этих событиях. Приведем простой пример: допустим, вы заметили, что ваш знакомый пенсионер Арман любит смотреть по телевизору соревнования по борьбе. Затем вы замечаете, что и Минни, и Сью Энн, тоже пенсионерки, любят смотреть такие соревнования. На основе этих наблюдений вы выдвигаете гипотезу о том, что пожилые люди любят смотреть соревнования по борьбе. Таким образом, вы переходите от наблюдений к гипотезе. Иногда индуктивный метод называют «переходом от частного к общему» Авторы прекрасной книги, которая называется «Индукция» (Holland et al., 1986), утверждают, что индуктивный процесс — это главный способ, с помощью которого мы постигаем природу мира. Они считают, что «исследовать индукцию — значит исследовать, как знание изменяется в процессе его использования» (р 5)

При использовании дедуктивного метода вы начинаете с гипотезы, которую считаете верной, а затем проверяете ее с помощью систематических наблюдений. Вы можете сделать логическое предположение о том, что, поскольку борьбой занимаются довольно молодые люди, пожилым людям нравится смотреть соревнования по телевизору. После выдвижения этой гипотезы вы начнете выяснять у знакомых пенсионеров, любят ли они смотреть по телевизору борьбу Вы также захотите сравнить их с группой людей помоложе, чтобы выяснить, смотрят ли они такие программы реже, чем пожилые люди. Когда вы начинаете с гипотезы, а потом собираете данные, подтверждающие или опровергающие эту гипотезу, то вы пользуетесь дедуктивным методом. Очень важно искать также и данные, опровергающие гипотезу. Иногда дедуктивный метод называют «переходом от общего к частному».

Несмотря на то, что эти два типа мышления обычно различают между собой, оба они являются просто различными фазами метода проверки гипотез. Часто люди наблюдают события, формулируют гипотезы, снова наблюдают события, переформулируют гипотезы и продолжают накапливать наблюдения. Вопрос о том, что первично — наблюдения или гипотеза, — является спорным, поскольку наши гипотезы определяют выбор объекта наших наблюдений, а наши наблюдения определяют, какие нам придут в голову гипотезы. Это похоже на вечный вопрос о том, что было раньше — курица или яйцо? Каждый из процессов существенно зависит от другого. Таким образом, наблюдения и выдвижение гипотез образуют замкнутый цикл, причем наблюдения изменяют гипотезу, а гипотеза изменяет объект наблюдения.

Если вы любите рассказы о Шерлоке Холмсе, то вы уже узнали этот процесс, который легендарный детектив превратил в высокое искусство. Он проницательно замечал приметы, указывавшие на потенциальных подозреваемых. Например, Шерлок Холмс мог вспомнить о том, что на брюках дворецкого было маленькое желтое пятно от горчицы, хотя хорошо известно, что горчицу не подают к гусю, который был в тот вечер на ужин. На основе этих наблюдений Холмс выдвигал гипотезу о том, что «дворецкий побывал на поле, где растет дикая горчица». Тогда великий сыщик проверял, соответствуют или противоречат этой гипотезе другие признаки. Он мог изучить ботинки дворецкого, чтобы выяснить, есть ли на них следы красной глины, из которой состоит почва вокруг горчичного поля. Выстроив длинную цепь гипотез и наблюдений, Шерлок Холмс заявлял: «Это сделал дворецкий». Когда его просили объяснить, как он пришел к такому заключению, он изрекал свою знаменитую фразу: «Элементарно, Ватсон!»

Многие из наших убеждений о мире были получены с помощью тех же индуктивных и дедуктивных методов, которыми пользовался великий Шерлок Холмс. Для формирования и проверки представлений мы применяем принципы индуктивных и дедуктивных рассуждений. Легендарный детектив Артура Конана Дойля неизменно приходил к правильным выводам. К сожалению, никогда не ошибаются только литературные герои. Давайте рассмотрим составляющие процесса проверки гипотез, чтобы выяснить, где могут возникнуть ошибки.

Рабочие определения

Как научное, так и повседневное мышление требуют обоснованного фактами подтверждения представлений, то есть соответствия теории и практики.

Кун (Kuhn, 1993, р. 74)

Рабочее определение объясняет читателю, как распознать и оценить интересующее его понятие. Например, если вы считаете, что женщины, достигшие успеха в жизни, получают высокую зарплату, то вам придется дать определения понятий «достигший успеха» и «высокая зарплата», которые позволят вам выяснить, кто достиг успеха и кто получает высокую зарплату. Если вы уже прочитали третью главу, то понимаете, что необходимость рабочих определений вытекает из проблемы неоднозначности. Вам придется ввести какое-либо суждение, вроде «Люди, достигшие успеха, — это те, кто известен в своей профессиональной области и кого уважают окружающие». Вы обнаружите, что часто бывает довольно трудно сформулировать хорошее рабочее определение. Я могу вспомнить нескольких человек, которые вовсе не пользуются известностью, но достигли успеха по их собственному мнению и по мнению других людей. Если вы воспользуетесь приведенным рабочим определением, то придете к выводу, что домохозяйки, техники, учителя, медсестры и многие другие не могут «достигнуть успеха» по этому определению. Таким образом, оно оказывается неудовлетворительным. Но все-таки, для примера, предположим, что мы будем относить людей к классам «достигших успеха» и «не достигших успеха» на основе такого рабочего определения.

Какое рабочее определение вы подберете для понятия «получать высокую зарплату»? Допустим, вы считаете, что «высокая зарплата» — это «минимум 1000 долларов в неделю». После того как эти понятия определены, вы можете начать выяснять, существует ли разница в оплате труда женщин, достигших и не достигших успеха. Рабочие определения имеют большое значение. Когда вы в очередной раз услышите, как люди говорят о «нашей безответственной молодежи», «мягкотелых либералах», «обливающихся кровью сердцах», «деревенщине», «реакционерах», «фашистах» или «феминистках», попросите их дать рабочие определения этих терминов. Может оказаться, что, после того как их попросят выражаться точнее, убедительность их доводов уменьшится.

Очень часто на рабочих определениях строится аргументация. Рассмотрим, например, дискуссию о том, является ли гомосексуализм психическим отклонением Ответ на этот вопрос зависит от рабочего определения. Что такое «психическое отклонение»? Кто будет решать, какое определение следует дать психическому отклонению? Обладает ли гомосексуализм характеристиками, соответствующими этому определению? Ожесточенные споры о том, является ли аборт убийством, можно превратить в гораздо более спокойное обсуждение адекватного определения убийства и опять-таки более важного вопроса о том, кто полномочен определять, что такое убийство. Таким образом, если с помощью критического мышления и не удастся прекратить яростные схватки по поводу таких проблем, как аборты, то хотя бы изменится их характер, поскольку люди смогут осознать, о чем они, собственно, спорят.

Когда вы пользуетесь рабочими определениями, вы избегаете двусмысленности и неопределенности. Попытайтесь для примера записать рабочие определения следующих терминов, любовь, предубеждение, мотивация, хорошие отметки, болезнь, спортивный, красивый и зрелость.

Независимые и зависимые переменные

Переменной называется любая измеримая характеристика, которая может иметь более одного значения. Примерами переменных являются пол (женский и мужской), рост, политическая принадлежность (республиканец, демократ, коммунист и т. п.), привычка пользоваться преимущественно одной рукой (правша, левша, одинаково владеющий обеими руками) и отношение к традиционным половым ролям (может изменяться в диапазоне от крайне отрицательного до крайне положительного). При проверке гипотез мы начинаем с выбора переменных, которые нас интересуют.

В сюжете, с которого начинается эта глава, вас просили определить, какая из двух программ лечения с большей вероятностью поможет вам отвыкнуть от героиновой зависимости. В этом примере две переменные — тип лечения, который является независимой переменной, т. е. вы можете его выбирать (программа 1 или программа 2), и излечение, которое является зависимой переменной, т. е. вы считаете, что эта переменная изменяется в зависимости от типа лечения вы либо а) излечитесь от наркомании, либо б) не излечитесь от наркомании. Вы хотите выбрать программу, которая поможет вам излечиться. В терминологии проверки гипотез вы хотите знать, какое значение независимой переменной благоприятно повлияет на зависимую переменную.

Следующим этапом процесса проверки гипотез является введение рабочих определений переменных. Предположим, что мы решили определить «излечение» как воздержание от наркотиков в течение минимум двух лет, а «неизлечение» — как воздержание от наркотиков в течение периода менее двух лет, куда входит и случай, если вы будете продолжать постоянно употреблять наркотики. Важно критически обдумать рабочие определения ваших переменных. Если они сформулированы неудовлетворительно, то заключение, к которому вы придете в результате своего исследования, может быть неправильным.

Чувствительность измерений

При измерении какой-либо величины мы постоянно придаем ей числовые значения, чтобы получить ее количественную характеристику. Рост человека, который выше вас, обозначается большим числом дюймов, чем ваш рост. Иначе понятие роста потеряло бы смысл.

Когда мы мыслим, как ученые, и собираем информацию, чтобы понять устройство мира, нам необходимо учитывать способ измерения переменных. Предположим, вы считаете, что любовь напоминает лихорадку и что у влюбленных бывают симптомы, похожие на симптомы лихорадки. Чтобы выяснить, верно ли это, вы можете провести эксперимент, измерив температуру у влюбленных и сравнив результаты с температурой людей, которые не влюблены. Как вы будете измерять температуру? Предположим, вы решили пользоваться ленточным термометром, который регистрирует температуру, когда его помещают на лоб пациента. Далее предположим, что этот прибор измеряет температуру, округляя ее до целых градусов (например, 36°, 37°, 38° и т. д.). Если от любви температура тела действительно повышается, но только на полградуса, вы этого никогда не узнаете, пользуясь ленточным термометром. Такие термометры просто недостаточно чувствительны для того, чтобы зарегистрировать небольшие отклонения температуры тела. Вы придете к неправильному заключению о том, что любовь не приводит к повышению температуры тела, хотя на самом деле это может быть не так. Насколько мне известно, подобный эксперимент никогда не проводился, но он хорошо демонстрирует необходимость учета чувствительности измерений в этой и других ситуациях.

Контингент и выборки

Каждый день люди принимают огромное количество решений, касающихся жизни и деятельности других людей Эти решения неизбежно чреваты ошибками, которые возникают из-за невежества, личных предубеждений или стереотипов.

У. Грант Дальстром (Dahlstrom, 1993, р 393)

Принимая решение о том, какую программу лечения от героиновой зависимости выбрать, или в каком колледже учиться, или на какую работу устроиться, вы делаете ставку на будущее событие, которое неизбежно связано с неопределенностью. Принципы проверки гипотез применяются для уменьшения этой неопределенности. Мы не можем полностью устранить неопределенность, но мы можем воспользоваться принципами проверки гипотез, которые помогут нам сделать оптимальный выбор. В примере, с которого я начала эту главу, вам пришлось бы изучить и оценить информацию о степени успешности обеих программ. Затем вы воспользовались бы этой информацией для принятия решения.

Группа людей, о которой мы хотим получить данные, называется контингентом. Поскольку очевидно, что для выявления более успешной программы лечения мы не можем обследовать всех людей, страдающих от героиновой зависимости, нам придется обследовать подгруппу этого контингента. Такая подгруппа называется выборкой. В данном примере выборку составляют все люди, которые лечились по каждой из программ.


Репрезентативные и нерепрезентативные (тенденциозные) выборки

Мы хотим, чтобы выборка была репрезентативной для нашего контингента. Чтобы выборка была репрезентативной, входящие в нее наркоманы должны быть мужчинами и женщинами из всех социально-экономических слоев общества, иметь различные уровни интеллекта, проживать в городских и сельских районах и т. д. Репрезентативная выборка необходима для того, чтобы можно было обобщить полученные результаты и решить, какая из программ в целом успешнее. Обобщением называется распространение результатов, полученных на выборке, на весь контингент, т. е. мы подразумеваем, что при обследовании всего контингента получили бы аналогичные результаты.

Что происходит, если выборка не репрезентативна для контингента? Предположим, что одна из программ стоит очень дорого, а другая программа предназначена для бедных и субсидируется государством. Это примеры нерепрезентативных (тенденциозных) выборок. Поскольку они не репрезентативны, вы не можете пользоваться ими для того, чтобы делать выводы обо всем контингенте наркоманов, употребляющих героин

Самое большое фиаско во всей истории выборок произошло, по-видимому, в 1936 г., когда журнал «Литературный дайджест» разослал по домашним адресам более 10 миллионов бюллетеней, чтобы предсказать результаты выборов президента, которые должны были состояться в том же году (Kimble, 1978). На этой большой выборке были получены совершенно ясные результаты: следующим президентом будет Альф Лэндон. Что, вы не знаете такого президента? Я уверена, что не знаете, потому что президентом США в 1936 г был избран Франклин Делано Рузвельт. В чем же было дело? Проблема состояла в том, как были отобраны избиратели, вошедшие в выборку. Бюллетени рассылались подписчикам этого литературного журнала, людям, чьи адреса были в телефонной книге, и владельцам автомобилей. Напоминаю, что дело было в 1936 г., когда только состоятельные люди подписывались на журналы и имели телефоны или автомобили. В выборку не было включено большое число менее богатых избирателей, многие из которых голосовали за Рузвельта, а не за Лэндона. Поскольку выборка была нерепрезентативной, нельзя было обобщать результаты на весь контингент. Несмотря на то, что в выборку было включено большое количество избирателей, результаты оказались неправильными, поскольку она была нерепрезентативной.

Часто бывает нелегко заметить, какое глубокое влияние оказывают нерепрезентативные выборки на получаемую нами информацию. Например, пользуются большой популярностью (возможно, потому, что кто-то зарабатывает деньги на оплате телефонных разговоров) телефонные опросы, в которых респонденты сами звонят, чтобы ответить на заданный вопрос. Предположим, телефонный опрос показал, что 75 % респондентов, позвонивших, чтобы выразить свое мнение о смертной казни, были против нее. Какие выводы можно сделать из этого? Абсолютно никаких! Опросы такого типа называются slops (selected listeners opinion polls), что означает «опрос мнений избранных слушателей», а также отражает их ценность (slops по-английски также означает «помои»). Только люди с крайними взглядами по какому-либо вопросу не пожалеют времени и денег на то, чтобы позвонить и выразить свое мнение. Хотя обычно перед этими опросами предупреждают, что «это не научные данные», комментатор затем переходит к изложению бессмысленных результатов, как будто они отражают общественное мнение.

Еще одной ловушкой при составлении выборки является возможность смешанного влияния факторов (confounding). Поскольку пациенты этих двух гипотетических программ лечения от героиновой наркомании отличаются между собой по нескольким признакам, — т. е. по первой программе консультации проводят ровесники, а наркоманы очень состоятельны, а по второй программе предлагается лечение другого типа, и пациенты очень бедны, — мы не можем определить, зависят ли различия в показателях выздоровления от типа лечения или от уровня доходов пациентов. Поскольку мы не можем разделить влияние типа лечения и уровня доходов пациентов, то по этим результатам нельзя судить о том, какой тип лечения успешнее.

Обычно ученые пользуются удобными (convenience) выборками. Они исследуют группу людей, которые легко доступны. Чаще всего участниками психологических экспериментов бывают студенты колледжей и крысы. Насколько широко можно обобщать результаты, полученные на этих выборках, зависит от того, какой вопрос вы исследуете. Если вы хотите понять, как работает человеческое зрение, студенты колледжа будут подходящими участниками, особенно если вас интересуют молодые и здоровые глаза. С другой стороны, если вы хотите разобраться в вопросе о стереотипизации половых ролей у взрослых, студенты колледжа не будут репрезентативной выборкой, поскольку по сравнению с другими взрослыми они менее склонны к стереотипизации. В этом случае вы можете обобщать результаты только на студентов колледжа.

Во время недавних выборов в Калифорнии велось много споров по вопросу о введении ваучерной системы для оплаты среднего образования. Как вам, возможно, известно, некоторые люди считают, что образование выиграло бы, если бы родители получали ваучеры на сумму, которую государство тратит на обучение ребенка в средней школе. Затем родители могли бы воспользоваться этим ваучером и выбрать любую школу, которую они считают наиболее подходящей для своего ребенка. Это сложная проблема, поскольку сторонники ваучеризации утверждают, что конкуренция приведет к повышению уровня всех школ, а противники доказывают, что богатые родители будут доплачивать и посылать своих детей в частные школы, в то время как бедные родители будут вынуждены отдавать ваучеры в более дешевые и слабые школы. Я не хочу обсуждать здесь вопрос о ваучерах, но приведу объявление, которое часто появлялось в печати в предвыборный период. Оно звучало примерно так:

Государственные школы Калифорнии плохо справляются с обучением наших детей. Знаете ли вы, что результаты старшеклассников из Калифорнии на вступительных экзаменах в колледж значительно ниже, чем результаты старшеклассников из штата Миссисипи?

Мышление авторов этого объявления можно подвергнуть критике по многим пунктам (включая и явную инсинуацию в адрес штата Миссисипи), но целью нашего обсуждения является только рассмотрение характера сравниваемых выборок. Вступительные экзамены в колледж сдают только те школьники, которые собираются учиться в колледже. В Калифорнии эти экзамены сдает гораздо большая часть старшеклассников, чем в Миссисипи. Хотя я не знаю точных фактических цифр, предположим, что в Калифорнии эти экзамены сдают 40 % лучших выпускников средней школы, а в Миссисипи — только 10 %. Теперь вы видите, почему можно ожидать, что выпускники из Миссисипи покажут лучшие результаты — из-за нерепрезентативности выборки. Существуют и другие причины, по которым можно ожидать, что эти результаты не связаны с качеством образования. В Калифорнии много недавно приехавших иммигрантов, потому многие учащиеся говорят по-английски не так хорошо, как те, для кого английский язык является родным. Из-за этого средний балл учащихся штата тоже может понизиться. Таким образом, опять дело в выборке, поскольку не проводится сравнение групп, которые отличаются лишь одной интересующей нас переменной (штат, в котором получено образование). Конечно, не исключено, что в Миссисипи школьники получают лучшее образование, чем в Калифорнии, но это не следует из приведенных данных.


Размер выборки

Получив наперсток фактов, мы делаем поспешные обобщения размером с целую лохань.

Гордон Олпорт (Allport, 1954, р. 8)

Количество испытуемых, включенных в выборку, называется размером выборки. Допустим, что по первой программе лечились 6 пациентов/испытуемых, а по второй программе — 10 пациентов/испытуемых. (Испытуемый — это человек, животное или организм, который участвует в эксперименте.) Обе эти выборки слишком малы, чтобы определить степень успешности лечения. При проведении экспериментов ученые часто используют большое количество испытуемых. Если по какой-то причине у них не окажется большого количества испытуемых, то, возможно, им придется осторожнее и консервативнее относиться к выводам, полученным с помощью своих исследований. Несмотря на то что обсуждение числа испытуемых, необходимых для проведения эксперимента, выходит за рамки этой книги, важно помнить, что для большинства повседневных целей мы не можем обобщать на весь контингент результаты наблюдений за реакциями небольшой группы людей.

Предположим, что с вами произошла следующая история. После нескольких месяцев колебаний вы, наконец, решили купить машину марки «Шевроле Камаро». Вы обнаружили, что эта машина имеет высокий рейтинг в двух журналах — в Consumer Reports («Отзывы потребителей») и Road and Track («Пути — дороги»). Цена «Камаро» укладывается в ваш бюджет, и вам нравится его обтекаемая форма и спортивный стиль. Выходя из дома, чтобы оформить сделку, вы встречаетесь с близкой подругой и сообщаете о своей предполагаемой покупке. «"Камаро?" — кричит она. — Брат моего мужа купил эту машину — это просто консервная банка. Она постоянно ломается на дороге. Ее так часто таскали на буксире, что пора заменять бампер». Что вы будете делать?

Большинству людей было бы трудно все-таки решиться на покупку, потому что они не обращают достаточного внимания на размеры выборки. Общенациональные журналы, вероятно, проверили много машин перед тем, как определили свой рейтинг. Брат мужа вашей подруги — это один испытуемый. Вам следует больше доверять результатам, полученным на больших выборках, по сравнению с результатами, полученными на маленьких (при условии, что «эксперименты» были одинаково корректными). Тем не менее, многие считают рекомендации единственного человека, особенно если это их знакомый, убедительнее информации, полученной на большой выборке.

Мы склонны игнорировать важность достаточно большого размера выборки, когда действуем как «интуитивные ученые». Именно поэтому рекомендации являются таким мощным средством убеждения людей, внушая им, что делать и во что верить. Но рекомендации основываются на опыте только одного человека, и часто этому человеку платят за то, чтобы он хвалил определенный товар. В моей коллекции есть реклама телефонных консультаций экстрасенса, где в качестве доказательства того, что советы экстрасенсов эффективно помогают решить целый ряд проблем, приводятся «реальные случаи». «Жительница города Лансинга в штате Мичиган вновь обрела интерес к жизни после одной беседы с экстрасенсом… А женщина из Питтсбурга (штат Пенсильвания) чувствует, что экстрасенс как будто заглянул прямо ей в душу» («Космополитен», январь, 1994). Чтобы эти комментарии звучали более правдоподобно и носили личный характер, авторы ссылаются на определенных людей, не называя их имен, но указывая название города и штата. Чем определеннее получаемая нами информация, тем больше вероятность, что мы поверим в ее истинность. Но дайте мне передохнуть!

Мне хотелось бы игнорировать информацию подобного типа, считая ее вздором, на который никто не купится, но мой опыт свидетельствует об обратном. Одна моя родственница истратила более 300 долларов на телефонные звонки экстрасенсам, когда ей нужно было принять важное решение, касавшееся лечения ее серьезно больного мужа. За эти деньги она получила советы, которые были в лучшем случае просто безвредными, а в худшем случае приводили к тому, что она пренебрегала рекомендациями больничных врачей. Позднее я узнала, что экстрасенсам запрещено предсказывать кому-либо смерть, поэтому они дали ей ложную надежду, из-за чего ей было еще тяжелее перенести смерть мужа. Я рассказываю эту истинную историю, коснувшуюся лично меня, потому что надеюсь, что она заставит вас задуматься о том, какие необходимы доказательства, чтобы заплатить сотни долларов за совет незнакомого и заинтересованного в ваших деньгах человека, у которого нет документов, подтверждающих его компетенцию в области психологии или науки.

Вариативность

Термин вариативность указывает на то, что не все люди одинаковы. Предположим, что вы знаете человека, который «дымил, как паровоз» и прожил до ста лет. Означает ли это, что гипотеза об отрицательном влиянии курения на здоровье неверна? Отнюдь нет. Влияние курения на здоровье определялось многими независимыми исследователями, которые работали с большим количеством испытуемых. Люди демонстрируют различные реакции, придерживаются разных мнений и имеют разные способности. При осмыслении результатов важно помнить о роли вариативности.

Несколько лет назад поднялось много шума вокруг применения лаэтрила (laetrile), т. е. экстракта абрикосовых косточек, для лечения рака. Несмотря на то, что официальная медицина Соединенных Штатов признала его бесполезность в борьбе против рака, многие люди продолжали верить, что с помощью лаэтрила можно излечиться. Предположим, что вы прочитали о человеке с диагнозом «рак», который затем принимал лаэтрил. Впоследствии этот счастливчик излечился от рака. Какие выводы вы сделаете? Захочется ли вам заключить, что, по крайней мере, в некоторых случаях лаэтрил может вылечить или помочь вылечить рак? Такое заключение необоснованно. Некоторые люди вылечиваются от рака, а другие — нет. Так же как люди различны по своим убеждениям и установкам, они по-разному реагируют на болезнь. Если размер выборки равен единице, мы не можем заключить, что лаэтрил внес свой вклад в выздоровление больного. Чтобы решить, полезен ли лаэтрил при лечении рака, необходимы широкомасштабные сравнительные исследования уровней выживания групп больных раком, которые лечились лаэтрилом, и групп больных, которые лечились другими способами. Когда государственные организации провели такие тесты, оказалось, что лаэтрил бесполезен. Легко понять, что отчаявшиеся больные раком поддаются заблуждению и верят в результаты, полученные на очень маленьком количестве людей.

Готовность людей поверить, что результаты, полученные всего на нескольких испытуемых, можно обобщать на весь контингент, называется законом малых чисел (Tversky Kahneman, 1971). На самом деле мы можем быть более уверены, когда работаем с большими выборками, а не с маленькими (Kunda Nisbett, 1986). При экспериментальном исследовании этого явления (Quattrone Jones, 1980) студенты колледжа продемонстрировали веру в то, что если один из членов группы принимает определенное решение, то другие члены этой группы примут такое же решение. Этот результат был особенно стойким, когда студенты одного колледжа наблюдали за решениями студентов других колледжей. Таким образом, мы видим, что вера в закон малых чисел способствует сохранению предрассудков и стереотипов. Мы склонны верить, что действия одного члена группы являются показателем действий всей группы. Слышали ли вы, как кто-нибудь говорит: «Все ____________________ (вставьте сюда название группы, к которой принадлежите) похожи друг на друга»? Одна знакомая как-то сказала мне, что все ямайцы — жулики и воры. Она пришла к такому заключению после одного неприятного инцидента, который произошел у нее с жителем Ямайки. Такого рода утверждения являются проявлением закона малых чисел. Теперь вы можете понять, как закон малых чисел может объяснить происхождение многих предрассудков, таких, например, как расизм? Единственное запомнившееся событие с участием члена группы, с которой мы редко вступаем в контакт, может повлиять на наши представления о всех остальных членах этой группы. Как правило, перед тем как прийти к какому-либо заключению, необходимо накопить большое количество наблюдений о людях и событиях.

Существует одно исключение из общего принципа, которое состоит в том, что для достоверных обобщений результатов на весь контингент необходимы большие выборки. Это исключение имеет место тогда, когда контингент совершенно однороден. Если, например, каждый человек из интересующего нас контингента совершенно одинаково отвечает на любой вопрос (например, «Одобряете ли вы смертную казнь?») или одинаково реагирует на любое лечение (например, не имеет «сердечных приступов» при лечении простым аспирином), то размер выборки больше не играет роли. Конечно, люди не бывают одинаковыми. Вы, вероятно, считаете, что об этом можно было бы и не говорить, поскольку все и так знают, что все люди разные. К сожалению, исследования показали, что большинство из нас склонно к недооценке изменчивости групп, которые нам не знакомы.

Члены всех групп меньшинств часто рассказывают, что лидеры или члены других групп обращаются к ним и спрашивают: «Что афроамериканцы (или женщины, или латиноамериканцы, или азиаты, или члены любой из групп меньшинств) думают по этому вопросу?» При этом как будто подразумевается, что несколько членов группы меньшинства могут говорить от имени всей группы. Это проявление нашей веры в то, что группы, к которым мы не принадлежим, гораздо более гомогенны (однородны), чем наша.

Способность к точному прогнозированию частично зависит от умения точно оценивать степень вариативности. Важно иметь это в виду всякий раз, когда вы проверяете гипотезу — в строго научной обстановке или при неформальных попытках определить причинные связи в своем повседневном окружении.

Определение причины

Верите ли вы, что дети, которыми пренебрегают родители, становятся малолетними преступниками? Помогает ли бег трусцой от депрессии?

Способствует ли диета с низким содержанием жиров увеличению продолжительности жизни? Правда ли, что одежда делает человека?

Дают ли глубокие духовные убеждения душевное спокойствие?

Способствуют ли занятия по критическому мышлению совершенствованию мышления студентов вне занятий?

Все эти вопросы касаются причинной связи, при которой считается, что одна переменная (например, пренебрежение родительскими обязанностями) является причиной другой переменной (например, правонарушений). Какая информация необходима для того, чтобы правильно установить причинные связи?

Изоляция и контроль переменных

Давайте остановимся и задумаемся над тем, каким способом можно воспользоваться, чтобы решить, приводит ли пренебрежение родительскими обязанностями к тому, что в подростковом возрасте дети становятся преступниками? Можно попробовать провести долговременное исследование, разделив детей на группы — одним родителям сказать, чтобы они удовлетворяли все потребности детей, другим — чтобы они пренебрегали некоторыми потребностями, а третьим — чтобы они полностью пренебрегали своими детьми. Вы можете потребовать, чтобы все участники эксперимента оставались в своих группах, заботясь о детях или пренебрегая ими, до тех пор, пока дети не достигнут подросткового возраста, когда вы подсчитаете число детей из каждой группы, которые стали преступниками — не забыв, конечно, дать операционное определение термину «преступник». Это было бы хорошим, хотя совершенно нереальным способом решения вопроса о том, приводит ли пренебрежение к правонарушениям. Этот способ хорош тем, что он позволяет вам контролировать степень пренебрежения каждым ребенком и изолировать причину преступлений, поскольку степень пренебрежения будет единственным систематическим различием между испытуемыми из разных групп. Этот способ нереален до абсурда, поскольку очень немногие люди согласятся на вашу просьбу пренебрегать детьми. Кроме того, было бы неэтично просить людей участвовать в экспериментах, последствия которых потенциально вредны.

В условиях некоторых экспериментов имеется возможность изолировать и контролировать интересующие нас переменные. Если вы хотите узнать, можно ли с помощью системы оценок добиться того, чтобы студенты колледжа стали учиться старательнее и знали больше, вы можете случайным образом распределить их по группам, которые будут оцениваться по-разному. Половина студентов будет получать только «зачет» или «незачет» (без обычных оценок), в то время как остальные будут получать традиционные численные оценки (2, 3, 4 или 5). В конце семестра все студенты будут сдавать одинаковый экзамен. Если средний балл по результатам экзамена у студентов, получавших численные оценки, будет статистически значительно выше, чем у студентов, получавших «зачет» или «незачет», можно сделать вывод, что система численных оценок действительно приводит к повышению успеваемости. (Вопрос о том, какие различия можно считать значительными, будет обсуждаться в главе 7.)

Понимаете ли вы, почему так важно распределить студентов по группам с различными системами оценок именно случайным образом, вместо того чтобы позволить им самим выбрать систему, которую они хотят? Не исключено, что студенты, которые выберут систему «зачет-незачет», имеют более слабую мотивацию к учебе или менее высокий уровень интеллекта, чем студенты, которые предпочитают получать численные оценки, или наоборот. Если бы студенты могли сами выбирать систему оценок, мы не знали бы, за счет чего появились обнаруженные нами различия в успеваемости — за счет различных способов оценки знаний или за счет различий в мотивации, уровне интеллекта или какой-либо другой переменной, в результате действия которой студенты выбирали систему оценок.

Давайте вернемся к вопросу о том, приводит ли пренебрежение детьми к правонарушениям. Как вам решить этот вопрос при имеющихся ограничениях (вы не можете просить родителей пренебрегать своими детьми)? Можно найти группу родителей и расспросить каждого из них, сколько внимания и заботы они уделяли своим детям. Предположим, что вы обнаружили, что, в целом, чем сильнее пренебрегают ребенком, тем больше шансов, что он станет преступником. Поскольку вы потеряли контроль над вашими переменными, не разделив родителей на группы заботящихся и пренебрегающих, то на основе одного этого эксперимента невозможно заключить, что пренебрежение детьми приводит к правонарушениям. Возможно, родители, которые пренебрегают своими детьми, отличаются от заботливых родителей и по другим показателям. Родители, склонные к пренебрежению родительскими обязанностями, могут также поощрять употребление наркотиков или вести такой образ жизни, который способствует формированию из детей малолетних правонарушителей. Поскольку родителей нельзя разделить на группы, то для получения заключения о существовании причинной связи придется провести несколько различных исследований. Я снова повторяю уже не раз проводившуюся в этой книге мысль: тот факт, что две переменные имеют место одновременно (пренебрежение и правонарушения), еще не означает, что одна из переменных является причиной другой.


Трехступенчатая схема эксперимента

Когда ученые хотят убедительно доказать существование причинной связи, они используют трехступенчатую схему эксперимента (Kimble, 1978). Схема эксперимента — это план, по которому проводятся наблюдения.

1. На первом этапе необходимо создать различные группы, которые будут исследоваться. В примере с влиянием оценок типа «зачет-незачет» на объем знаний это группа студентов, получающих численные оценки, и группа студентов, которые получают «зачет» или «незачет».

Важно, чтобы эти группы не имели между собой других значимых различий. Нельзя, чтобы все студенты из первой группы посещали лекции профессора Занудного, а все студенты из второй группы занимались у профессора Бормотухина. Один из профессоров может преподавать лучше, и из-за этой дополнительной переменной студенты из одной группы узнают больше, чем студенты из другой группы. Один из способов избежать смешанного влияния переменных — это оценивать половину студентов каждой группы по одной из систем, причем разделение на половины произвести случайным образом. Для того чтобы причинная связь было строго обоснованной, в начале эксперимента группы должны быть поставлены в равные условия. Случайное распределение испытуемых по группам является принципиальным требованием при определении причинной связи.

2. Вторым этапом является «применение экспериментального воздействия». Если бы мы исследовали влияние лекарства, то одна группа получала бы лекарство, а вторая — нет. Обычно, группа, которая не получает лекарство, получает плацебо, т. е. вещество, которое имеет такой же внешний вид и вкус, как лекарство, но химически нейтрально. Плацебо дают для того, чтобы избежать влияния психологических факторов — веры испытуемых в эффективность лекарства и связанных с этим ожиданий. Тема ожиданий и их роли в тенденциозной интерпретации результатов будет обсуждаться ниже в этой главе. Как мы уже знаем, когда подобные методы были использованы для проверки эффективности лаэтрила, оказалось, что он не помогает от рака. В эксперименте с оценками термин «воздействие» означает обучение в условиях применения одной из двух систем — бинарной или численной.

3. Последним этапом является оценка полученных результатов. Проводятся измерения, и две (или более) группы сравниваются по определенному итоговому показателю. Если бы исследование касалось нового лекарства от головной боли, то сравнивалась бы частота и сила головных болей у испытуемых из разных групп. В примере с оценками результаты итогового экзамена у студентов из группы с численными оценками сравнивались бы с результатами студентов из группы «зачет-незачет». Если результаты у одной из групп окажутся значительно выше, чем у другой, то мы получим сильное подтверждение гипотезы о том, что одна из систем оценок вызывает повышение старательности студентов и приводит к увеличению объема их знаний.

Конечно, не всегда имеется возможность в начале опыта поставить группы в равные условия и распределить испытуемых по группам случайным образом, но когда это возможно, результаты могут быть использованы для подтверждения более сильных причинных связей, чем в условиях менее строгого контроля.

Рассмотрим следующий гипотетический пример:

Исследователи из Университета Умников изучали причины разводов. Они обнаружили, что 33 % недавно разведенных супружеских пар говорят, что в течение двухлетнего периода, предшествовавшего разводу, у них были серьезные разногласия по поводу денег. Ученые сделали вывод, что материальные разногласия являются главной причиной разводов. В качестве способа снижения уровня разводов они предлагают супружеским парам научиться справляться с этими разногласиями.

Правилен ли «ход рассуждений»? А если есть ошибки — в чем они? Их здесь очень много. Во-первых, у нас нет сравнительных данных о группе пар, которые не развелись (т. е. нет контрольной группы). Может быть, в 33 % всех семей возникают разногласия по поводу денег; может быть, процент этих разногласий еще выше среди семей, которые не развелись. Во-вторых, нет основания считать, что материальные разногласия вызвали развод или даже ему способствовали. Может быть, в распадающихся семьях возникает больше разногласий по любому поводу. В-третьих, возникает проблема, связанная с ретроспективными исследованиями, которую мы подробнее обсудим в следующем разделе. Исследования, подобные этому, встречаются на каждом шагу: в ток-шоу на радио, в выпусках новостей, научных журналах или в собственных объяснениях причин тех или иных жизненных событий, которые дают люди. Если при интерпретации комментариев такого рода вы будете опираться на принципы проверки гипотез, то у вас меньше шансов быть обманутыми.


Применение принципов изоляции и контроля

В предыдущих главах я приводила замечание Пиаже о том, что люди, достигшие высшей ступени когнитивного развития, могут рассуждать о гипотетических ситуациях. Пиаже назвал высшую ступень когнитивного развития стадией формального мышления. Он разработал несколько типов заданий, с помощью которых можно определять, способен ли человек мыслить на этом уровне. Если вы уже читали главу 4, то помните задачу на «комбинаторное мышление», разработанную Пиаже. Для ее выполнения необходима планомерная и упорядоченная процедура выбора сочетаний объектов. Еще одна из задач Пиаже основана на использовании принципов изоляции и контроля, которые являются частью проверки гипотез. Попробуйте выполнить это задание.

Сгибание стержней. Задача заключается в том, чтобы определить, какая из нескольких переменных влияет на гибкость стержней. Представьте себе, что вам дали длинную вертикальную планку, к которой прикреплены 12 стержней. Каждый из стержней сделан из латуни, меди или стали. Стержни бывают двух различных длин и двух различных диаметров. Ваша задача — определить, какая из переменных (материал, длина или толщина) влияет на степень гибкости стержня. Вы можете проверять гибкость каждого стержня, нажимая на его свободный конец и наблюдая, насколько стержень согнется. Вы можете провести сколько угодно опытов, пока не сможете объяснить, какие факторы определяют гибкость стержней. Возможно, вам будет легче представить себе условия эксперимента, если вы посмотрите на рис. 6.1. Что вы должны сделать, чтобы доказать, что гибкость стержня определяется его длиной, или диаметром, или материалом, из которого он сделан, или каким-либо сочетанием этих переменных? Остановитесь на этом месте и запишите свой план решения этой задачи. Не продолжайте чтение, пока не закончите решать задачу.


Рис. 6.1. Сгибание стержней.

Как бы вы определили, что влияет на гибкость стержня — материал, длина или толщина?

Решение задачи о сгибании стержней. Каким способом вы исследовали влияние длины, диаметра и материала на гибкость стержня? Чтобы решить эту проблему, вам надо рассмотреть возможные факторы, от которых может зависеть гибкость стержня, а затем методично поддерживать все переменные, кроме одной, неизменными. Это основная концепция экспериментальных методов. Если вы хотите выяснить, влияет ли на гибкость материал, какие стержни вы будете проверять? Вы будете сгибать медный, латунный и стальной стержни одинаковой длины и диаметра. Таким образом, при проверке влияния переменной «материал», переменные «длина» и «диаметр» будут оставаться постоянными. Одним из возможных при таком подходе опытов является сравнение гибкости коротких и толстых стержней, сделанных из латуни, меди и стали. Точно так же, если вы хотите выяснить, имеет ли значение длина, вы будете сгибать короткие и длинные стержни одинакового диаметра и сделанные из одного материала. В качестве примера можно привести сравнение короткого и толстого медного стержня с длинным и толстым медным стержнем.

Как вы решите, влияет ли диаметр на гибкость стержня? Теперь уже ясно, что для этого надо сравнить два стержня одинаковой длины и сделанные из одного материала, но имеющие разные диаметры. Это можно сделать, сгибая короткий и толстый стальной стержень и короткий и тонкий стальной стержень. Таким образом, вы должны понять, что для решения этой задачи необходимы те же принципы, которые используются при проверке гипотез, и вы должны уметь их правильно применять.

Проспективные и ретроспективные исследования

Рассмотрим пример из области медицины: некоторые медицинские психологи считают, что стрессовые переживания могут вызывать у людей рак. Если бы это была ваша гипотеза, как бы вы проверили ее обоснованность? Один из способов — опросить больных раком; происходили ли с ними события, вызвавшие сильный стресс, непосредственно перед тем, как им был поставлен диагноз. Если стресс приводит к раку, то он должен предшествовать развитию болезни. Опыты, которые проводятся описанным образом, называются ретроспективными экспериментами. При ретроспективных экспериментах исследуется прошедшее, чтобы понять причины последовавших за ним событий. При экспериментах такого рода возникает много проблем. Как уже говорилось в главе 2, память избирательна и уступчива. Не исключено, что, узнав о болезни, человек будет по-другому вспоминать свое прошлое. Он может причислить к травмирующим событиям происшествия, вызывавшие лишь умеренный стресс, такие как плохая оценка по какому-нибудь предмету в колледже. Радостные события, например, повышение по службе, могут быть забыты. Возможно даже, что стресс был сам вызван ранней стадией рака, а не привел к его развитию. Поэтому с помощью ретроспективных исследований трудно определить, вызывает ли стресс заболевание раком.

Проспективные исследования являются более подходящим методом для понимания причинных связей. При этом типе исследований вы выделяете возможные причины в тот момент, когда они появляются, а затем рассматриваете следующий за ними период времени, чтобы выяснить, появились ли гипотетические результаты. При перспективных исследованиях вы бы попросили большую группу людей записывать вызывающие стресс жизненные события (например, смерть супруга, тюремное заключение, потеря работы), когда они происходят, а затем проследили бы, у кого из этих людей разовьется рак. Если вероятность возникновения рака больше у тех, кто пережил более сильный стресс, то это подтверждает вашу гипотезу.

Большинство исследований, которые мы проводим как «интуитивные ученые», являются ретроспективными. Мы часто ищем объяснения уже произошедших событий. Сколько раз вы пытались понять, почему ребенок с ангельской внешностью совершил серьезное преступление, почему новая «звезда» потеряла контакт с аудиторией или почему никудышный политик победил на выборах? Наши попытки найти ретроспективные объяснения событий обречены на ошибки из-за селективности памяти и отсутствия системы в наблюдениях. (Обсуждение этих вопросов см. в разделе о ретроспективной оценке и предвидении будущего в главе 8.)

Корреляция и причинная связь

Процесс, с помощью которого дети превращают свой опыт в знания, как две капли воды похож на процесс, с помощью которого те, кого мы называем учеными, получают научные знания.

Хольт (Holt, 1989, р. 93)

То, что вы сейчас прочитаете, абсолютная правда: с возрастанием веса ребенка увеличивается и количество вопросов стандартного теста интеллекта, на которые он может правильно ответить. Другими словами, чем ребенок тяжелее, тем на большее число вопросов он отвечает. Перед тем, как пичкать своих детей картофельным пюре, чтобы они поумнели, остановитесь и подумайте, что означает приведенное утверждение. Означает ли оно, что от увеличения веса ребенок станет умнее? Вовсе нет! Вес ребенка увеличивается с возрастом, а старшие дети правильно отвечают на большее количество вопросов, чем младшие дети.

В приведенном примере переменные «вес» и «количество вопросов, на которые может правильно ответить ребенок», соотносятся друг с другом. Увеличение одной из переменных связано с увеличением второй переменной — возрастанию веса сопутствует по времени увеличение количества правильных ответов. Коррелирующие переменные — это две или несколько переменных, которые соотносятся между собой. Если вы уже прочитали главу 5, то узнаете в этом подходе ложный довод, называющийся ложной причиной.

Люди часто путают корреляцию с причинной связью. Рассмотрим следующий пример: Уолли и Боб спорили о наследственной природе интеллекта. Уолли вспомнил всех своих знакомых и пришел к выводу, что поскольку, как правило, у умных родителей бывают умные дети, а у глупых родителей — глупые дети, то интеллект передается по наследству. Боб не согласился с ходом рассуждений Уолли, хотя согласился с приведенными им фактами. Он был согласен с тем, что если при тестировании интеллекта родители получают высокие баллы, то и их дети, скорее всего, получат высокие результаты, и то же самое справедливо для низких баллов. Когда две переменные соотносятся таким образом — т. е. возрастают и убывают одновременно, — то между ними существует положительная корреляция. Хотя между интеллектом родителей и интеллектом детей существует положительная корреляция, мы не можем заключить, что интеллект детей зависит именно от родителей (через наследственность или каким-либо другим образом). Не исключено, что дети влияют на интеллект своих родителей или те и другие находятся под влиянием какого-то третьего, не учтенного фактора. Возможно, уровень интеллекта зависит от рациона, уровня доходов или других переменных, связанных с образом жизни, а поскольку эти переменные у членов одной семьи одинаковы, у них, как правило, одинаковый уровень интеллекта.

Теперь давайте рассмотрим другой пример. Многие занимаются бегом трусцой, потому что считают, что физическая нагрузка поможет им избавиться от лишнего веса. В этом примере переменными являются физическая нагрузка и вес. Я слышала, как некоторые утверждали, что поскольку не бывает толстых спортсменов (за исключением, пожалуй, борцов сумо), физическая нагрузка делает людей стройными. Надеюсь, вы можете подойти к этому утверждению критически.

Кажется, что между физической нагрузкой и весом действительно существует корреляция. Люди, которые любят тренироваться, как правило, бывают худыми. Такая корреляция, при которой тенденция к росту одной переменной (физическая нагрузка) связана с тенденцией к убыванию другой переменной (вес), называется отрицательной корреляцией. Давайте обдумаем связь между физической нагрузкой и весом. Существует несколько возможностей: а) возможно, физическая нагрузка приводит к похудению; б) возможно, худые люди склонны тренироваться больше, потому что худому человеку приятнее тренироваться; или в) возможно, что как склонность к тренировкам, так и предрасположенность к похудению вызваны какой-то третьей переменной, например заботой о собственном здоровье либо наследственными факторами. Может быть, существуют наследуемые типы телосложения, при которых люди без всяких усилий остаются стройными и наделены сильными мышцами, которые хорошо приспособлены для физической нагрузки.

Если вы хотите проверить гипотезу о том, что физическая нагрузка приводит к потере в весе, то используйте описанную выше трехступенчатую схему. Если испытуемые, которые случайным образом были отнесены к экспериментальной группе (тренирующейся), по истечении периода воздействия окажутся стройнее, чем те, кто не тренировался, то можно обоснованно заключить, что физическая нагрузка полезна для похудения.

На самом деле вопрос о причинах того или иного явления, как правило, сложен. Вероятно, точнее было бы использовать слово «влияние», а не «причина», потому что обычно на переменную влияет не одна другая переменная, а несколько. Мой коллега (д-р Ричард Блок из университета штата Монтана) предложил для пояснения этой мысли следующий пример: по какой причине человека, совершившего преступление, отправляют на виселицу — потому что кто-то дал ему деньги, на которые он купил оружие для совершения преступления; или потому что кто-то видел, как он совершил преступление; или потому что его никто не остановил? Единственную непосредственную причину удается определить довольно редко.

В целом, при рассмотрении связи между переменными существует несколько возможных объяснений. Кроме того, разумеется, возможно, что они вообще не соотносятся, или не коррелируют. Примерами переменных, между которыми нет корреляции, являются скорость печатания и размер шляпы машинистки, количество волос на голове и средний балл, рост водителя и скорость его реакции на экзамене по вождению.

Положительная корреляция существует между ростом и весом человека, между количеством церквей и числом проституток в городе (возрастает с ростом населения) и между количеством проданного мороженого и количеством зарегистрированных изнасилований (возрастает с повышением температуры воздуха). Примерами отрицательной корреляции являются количество потребляемого детьми фтора и количества их зубов, пораженных кариесом, количество часов, которые студент посвящает занятиям, и число провалов на экзаменах. При выяснении связи между двумя коррелирующими переменными может оказаться, что переменная А вызывает изменения переменной В (А → В), или что переменная В вызывает изменения переменной А (В → А), или что A и В одновременно воздействуют друг на друга (А → В и В → А), или что изменения переменных А и В были вызваны третьей переменной С (С → А и С → В).


Мнимая корреляция

Мунсон (Munson, 1976) приводит забавный анекдот о том, как одно событие принимают за причину другого из-за того, что они происходят одновременно:

Фермер ехал со своей женой на поезде и увидел, как сидящий напротив человек достал что-то из сумки и начал есть. «Эй, мистер, — спросил фермер, — что это вы едите?» «Это банан, — ответил человек, — хотите, попробуйте сами».

Фермер взял банан, очистил его, и как раз в тот момент, когда он проглотил первый кусочек, поезд влетел в тоннель. «Не ешь его, Мод, — закричал он жене, — ты ослепнешь!» (р. 277)

Правда ли, что блондинки больше шутят? Авторы популярной рекламы краски для волос хотят заставить вас поверить, что если вы осветлите свои волосы, вам станет веселее жить. Многие считают, что раз они часто видят, как блондинки веселятся, блондинки живут веселее, чем, например, брюнетки. В этих наблюдениях есть одна загвоздка — существует множество блондинок, которые не развлекаются больше других (кстати, этому выражению крайне необходимо рабочее определение), но вы их не учитываете, потому что они сидят у себя дома или где-нибудь еще, где у вас мало шансов их увидеть. Термин мнимая корреляция введен для обозначения ошибочного мнения о наличии связи между двумя переменными в ситуации, когда на самом деле они не соотносятся (Chapman Chapman, 1967, 1969).

Представления о связях, существующих в мире, есть как у специалистов, так и у неспециалистов. Эти представления определяют характер наблюдений, которые они делают, и способ, с помощью которого ими определяется наличие связи между переменными.

Давайте рассмотрим еще один пример. Часто ли вы видите, как толстяки объедаются? Большинство людей ответит «да». Тем не менее, исследования показывают, что взрослые люди с избыточным весом в общественных местах склонны есть меньше, чем люди с нормальным весом. Мы ожидаем увидеть, что толстяки едят очень много, и видим мир в соответствии со своими представлениями. Когда вы выступаете в роли «интуитивного ученого», остерегайтесь мнимых корреляций. Это явление способствует поддержанию стереотипных мнений (например, рыжие — вспыльчивы, шотландцы — скупы, женщины не разбираются в математике и т. д.). Наши представления о связях между переменными определяют то, какие наблюдения мы делаем и как используем полученную информацию для формулирования заключений.

Валидность

Валидность оценки обычно определяют как степень, до которой эта оценка характеризует именно то, что вы хотите оценить. Если бы я хотела оценить уровень вашего интеллекта и для этого измеряла длину вашего большого пальца на ноге, то эти измерения явно не были бы валидными. Другие примеры валидности не столь очевидны. Популярная радиореклама, расхваливая суп, указывает на то, что в томатном супе больше витамина А, чем в яйцах. Это верно, но не является обоснованной оценкой качества томатного супа. Яйца не являются богатым источником витамина А. Таким образом, проведены неправильные сравнения, и оценка не подтверждает заключение о том, что этот суп представляет собой отличный продукт питания. Если вы уже прочитали главу 5, то должны понимать, что заявление о том, что в томатном супе больше витамина А, чем в яйцах, не поддерживает заключение, что «этот суп — отличный продукт питания». Весьма возможно, что этот суп является прекрасным источником витаминов, но утверждения, подобные приведенному, не поддерживают это заключение.

Как вы прореагируете на следующее утверждение: «Baroness — это блестящая новая шикарная машина, которая будет для своего владельца надежным средством передвижения в течение долгих лет Действительно, при недавно проведенных лабораторных испытаниях Baroness разогналась от 0 до 60 миль в час всего за 7 секунд, опередив шесть других машин, участвовавших в состязаниях». Является ли скорость разгона машины обоснованным показателем ее надежности? Вероятно, нет. Даже если здесь приведены точные цифры, они не являются обоснованной мерой надежности машины. Если вы хотите узнать о ее надежности, вам необходимо выяснить, как часто она требует ремонта, какой средний пробег совершает до того, как превратится в металлолом и насколько она прочна при столкновениях.


Конвергентная (сходящаяся) валидность

Когда несколько различных оценок сходятся к одному заключению, то говорят, что эти оценки имеют конвергентную валидность. Если вы, например, хотите измерить харизму — психологическое качество, несколько большее, чем просто обаяние, и присущее, как считается, столь разным людям, как Тина Тернер, Пол Маккартни и Роберт де Ниро, — вам потребуется, чтобы ваши оценки были конвергентными. Вы должны выбрать такой способ оценки харизмы, чтобы высокую оценку получали люди, которых выбирают на посты лидеров и которые обладают другими личными характеристиками, обычно связанными с харизмой. Если согласно условиям вашего теста высокий результат получит девушка, не пользующаяся успехом в вашем классе, то вам надо еще раз задуматься о валидности теста.

Люди, не занимающиеся научной работой, тоже должны помнить о необходимости конвергентной валидности. Для того чтобы заключить, что ваша одноклассница Уилла Мэй застенчива, потому что колеблется перед тем, как заговорить с вами, надо выяснить, проявляется ли ее застенчивость в других местах и с другими людьми. Если она часто поднимает руку и выступает на занятиях, то вы не можете сделать вывод о ее застенчивости, поскольку такая непоследовательность в поведении указывает на отсутствие конвергентной валидности.

Идея конвергентной валидности весьма напоминает конвергентную структуру аргументации, которая рассматривалась в главе 5. Если вы уже прочитали главу 5, то помните, что сила аргументации увеличивается, если заключение поддерживают (или к нему сходятся) много посылок. Точно такая же ситуация возникает, когда несколько источников данных подтверждают одну гипотезу. В этих случаях используется различная терминология (поддержка заключения и подтверждение гипотезы), но за ней стоит одна и та же мысль: чем больше доводов или свидетельств мы можем привести в пользу истинности какого-либо утверждения, тем сильнее может быть наша уверенность в его истинности.


Мнимая валидность

Все жалуются на память, но никто не жалуется на свои суждения.

Ларошфуко (1613–1680)

Как специалисты, так и неспециалисты испытывают глубокую уверенность в своих выводах о большинстве жизненных событий, даже если эта уверенность не обоснована объективными данными. Чрезмерная уверенность в суждениях называется мнимой валидностью. При экспериментальном исследовании этого явления Оскамп (Oskamp, 1965) обнаружил, что, по мере того как врачи получали все больше информации о своих пациентах, они испытывали все большую уверенность в своих суждениях об этих пациентах. Этот результат любопытен тем, что суждения не становились точнее, — врачи лишь больше верили в свою правоту. Почему люди доверяют ошибочным суждениям? Существует несколько причин, по которым мы упорно сохраняем уверенность в своих суждениях. Одним из главных факторов является селективная природа памяти. Рассмотрим эпизод из моих личных воспоминаний: когда я была маленькая, я часто смотрела с отцом по телевизору матчи по бейсболу с участием команды Philadelphia Phillies. Как только очередной игрок с битой приближался к базе, мой отец восхищенно кричал: «Он сейчас забьет, я точно знаю!» Конечно, чаще всего он ошибался. (Болельщикам Phillies в 1950-е и 1960-е гг. приходилось туго.) В тех редких случаях, когда игрок действительно забивал, мой отец потом неделями рассказывал об этом: «Да, как только он подошел к базе, я понял, что он сейчас забьет. Мне всегда это ясно, стоит только взглянуть на игрока». В этом и в огромном количестве других случаев мы выборочно вспоминаем свои удачные суждения и забываем неудачные. Это поддерживает нашу уверенность в собственных суждениях.

Второй причиной мнимой валидности является то, что мы не ищем и не учитываем противоположную информацию. (Дополнительное обсуждение этого явления будет проведено в главе 8.) Это основная причина, по которой люди склонны верить, что между переменными существует корреляция, когда на самом деле ее нет. Допустим, вы работаете в отделе кадров большой корпорации. В течение года вы приняли на работу в корпорацию 100 новых сотрудников. Как проверить, насколько правильные (валидные) решения вы приняли, наняв их? Большинство людей для этого проверили бы, как работают эти новые сотрудники. Предположим, что вы провели такую проверку и обнаружили, что 92 % из них выполняют свою работу компетентно и профессионально. Усиливают ли эти выводы вашу уверенность в своих суждениях? Если на этот вопрос вы ответили «да», то вы забыли рассмотреть противоположные данные. Вы не учли тех людей, которых вы не приняли на работу. Может быть, большинство из них стали вице-президентами в компании «Дженерал Моторс»? Если вы обнаружите, что 100 % из тех, кого вы не взяли на работу, занимают высокие посты в компании ваших конкурентов, то вам необходимо пересмотреть свою уверенность в умении судить о людях.

Мы не учитываем противоположную информацию частично из-за того, что во многих случаях ее невозможно получить. У работников отделов кадров нет информации о тех сотрудниках, которых они не взяли на работу. Аналогичным образом мы не располагаем большим количеством данных о человеке, с которым решили не встречаться, или о предмете, лекции по которому решили не посещать, или о доме, который не купили. Таким образом, имея лишь часть информации, мы можем заключить, что наши суждения лучше, чем они есть на самом деле.

Проведя критический обзор теста Роршаха (обычно этот тест называют «тестом чернильных пятен», потому что испытуемых просят сказать, что они видят в бесформенных симметричных чернильных пятнах), Доус (Dawes, 1994) пришел к выводу, что этот тест не является валидной оценкой умственного функционирования. Он не нашел подтверждений его полезности при диагностике или лечении умственных расстройств (хотя с помощью этого теста можно выявить людей, которые дают необычные ответы). Это означает, что тест Роршаха не валиден. Однако Доус сообщает, что некоторые психотерапевты так прореагировали на эти эмпирические результаты: «Да, я знаю, что тест не валиден, но я нахожу его полезным». Вам не кажется смешным такое утверждение? Если тест не валиден, то он не может быть полезным. Если психотерапевты считают его полезным, они обманывают себя и демонстрируют пример мнимой валидности. Тест может казаться им полезным, поскольку они интерпретируют ответы пациентов способами, которые, по их мнению, имеют смысл, но его реальная ценность заключается лишь в наглядной демонстрации нашей приверженности к стереотипным мнениям.

Надежность

Надежность оценки — это постоянство, с которым она оценивает именно то, что нужно оценить. Если бы вы для измерения длины своего стола пользовались резиновой линейкой, которая может растягиваться или сжиматься, то при каждом измерении вы, вероятно, получали бы разные результаты. Конечно же, мы хотим, чтобы наши измерения были надежными.

Ученые, занимающиеся общественными и естественными науками, уделяют большое внимание проблеме надежности измерений. Например, тест интеллекта считается надежным тогда, когда один и тот же человек получает результаты, которые лежат в одном и том же диапазоне при каждом тестировании. Когда мы выступаем в роли «интуитивного ученого», мы редко учитываем надежность. Приходя к выводу о необъективности преподавателя или студента, мы часто полагаемся на один или два примера поведения без учета надежности нашей оценки этого человека.

Предположим, вы узнали, что ваш друг Рикардо провалился на экзамене, который все остальные легко сдали. Можете ли вы заключить, что его преподаватель с предубеждением относится к латиноамериканцам? Для этого необходимо собрать много других наблюдений за преподавателем и выяснить, насколько часто латиноамериканцы проваливаются у него на экзаменах. Если процент таких провалов в его классе необычно высок по сравнению с другими классами, то у вас есть веские основания заключить, что преподаватель с предубеждением относится к латиноамериканцам. Без тщательных измерений и, в данном случае, без выборки большего размера вы не можете сделать вывода о необъективности преподавателя.

Обдумывание ошибок

Для ученого теория — это нечто, требующее проверки. Он стремится не к защите своих убеждений, а к их усовершенствованию. Кроме всего прочего, он еще и специалист по «изменению своих мнений».

Уэнделл Джонсон

Когда мы пытаемся понять взаимосвязи путем выдвижения и проверки гипотез, мы иногда ошибаемся. Эта мысль обсуждается подробнее в главе 7, которая касается понятия вероятности. Пока давайте рассмотрим такую ситуацию: предположим, что вы каждый день ездите на работу с приятелем. Каждое утро вы останавливаетесь у окна кафе для автомобилистов и покупаете кофе. Вы решили, что, вместо того чтобы каждое утро спорить, кто будет платить («Я заплачу» — «Нет, нет позволь мне»), друг будет бросать монету. Если выпадет орел, заплатит он; если выпадет решка — заплатите вы. Звучит довольно странно, но за последние 10 дней монета 9 раз выпала решкой вверх. Как вы думаете, не жульничает ли ваш приятель?

Истина заключается в том, что он либо жульничает, либо нет. К сожалению, вы не знаете, какой из двух вариантов ответа — правда. Тем не менее вам надо принять решение. Вы либо решите, что ваш приятель жульничает, либо решите, что он не жульничает. Таким образом, существуют четыре возможности: а) он жульничает, и вы правильно решите, что он жульничает; б) он не жульничает, и вы правильно решите, что он не жульничает; в) он жульничает, и вы неправильно решите, что он не жульничает; г) он не жульничает, и вы неправильно решите, что он жульничает. Из этих четырех возможностей в двух случаях вы можете оказаться правы и в двух случаях вы можете ошибиться. Эти четыре комбинации представлены в табл. 6.1. Как видно из табл. 6.1, в любой ситуации при проверке гипотезы мы можем совершать ошибки двух типов. Эти два типа не являются одинаково «плохими». Гораздо хуже решить, что ваш друг жульничает, если на самом деле он этого не делает (особенно если вы обвините его в мошенничестве), чем решить, что он не жульничает, когда он именно этим и занимается. По этой причине вам необходимы более веские свидетельства для подтверждения факта его жульничества, чем для подтверждения его честности. Другими словами, при проверке гипотезы вам необходимо учитывать степень «вредности» различных ошибок.

Если вы будете изучать статистику или экспериментальное проектирование, то обнаружите, что эти науки справляются с проблемой различной «вредности» ошибок, требуя для различных решений различные уровни уверенности. Необходимость рассмотрения ошибок различных типов возникает во многих контекстах. Согласно основному принципу нашего законодательства, для того чтобы можно было обвинить человека в совершении преступления, необходима сильная уверенность в этом (отсутствие обоснованных сомнений). И наоборот, нам не нужно отсутствия обоснованных сомнений в невиновности подозреваемого, поскольку ошибочное решение о невиновности считается менее серьезной ошибкой, чем ошибочное решение о виновности. Точно также при неформальной проверке гипотез вам необходимо помнить о степени серьезности ошибок различных типов. Перед тем как решить, например, что, сколько ни старайся, вы все равно не осилите какой-либо предмет или что лекарство, которое вы принимаете, вам помогает или не помогает, необходимо рассмотреть последствия правильного и неправильного решений. Для некоторых решений необходима большая степень уверенности в своей правоте, чем для других.

Таблица 6.1. Четыре возможных исхода в примере «Кто покупает кофе»

Примечание. Ошибочное решение, что он жульничает, гораздо более серьезная ошибка, чем ошибочное решение, что он не жульничает. В связи с этой неравноценностью степени серьезности ошибок вам нужно иметь большую уверенность, когда вы решаете, что он жульничает, чем когда вы решаете, что он не жульничает.

Опыт — слишком дорогой учитель

Предположим, что ваша подруга поделилась с вами своим «секретом» похудения — она натирает живот и другие «проблемные зоны» чесноком, и жир как будто тает. Вы сомневаетесь, но она настаивает: «Я знаю, что это действует. Я пробовала и собственными глазами видела результаты». Я уверена, что многие люди прореагируют на такие рекомендации, натерев чесноком участки своего тела, на которых имеется лишний жир. Точно так же многие с энтузиазмом глотают пилюли из молотого пениса носорога, чтобы повысить свою сексуальную потенцию, поливитамины, чтобы меньше утомляться, и корень женьшеня от всех остальных болезней. Вы можете даже пополнить ряды тех, кто расхваливает подобные средства, потому что иногда можно похудеть, натеревшись чесноком — иногда желательный эффект наступает после некоторых действий (таких как прием капсул с молотым пенисом носорога). Но был ли этот эффект вызван данными действиями? На такой вопрос можно ответить, только пользуясь принципами проверки гипотез. Личный опыт не дает ответа.

Доус (Dawes, 1994) внес поправки в знаменитое выражение, которое приписывают Бенджамину Франклину. Оказывается, Франклин не говорил «опыт — лучший учитель»; вместо этого он сказал «опыт — дорогой учитель», подразумевая под словом «дорогой» «дорогостоящий, «дорого обходящийся». Иногда нам удается постоянно пользоваться обратной связью, получая сведения о том, что действует, а что не действует, так что мы можем применять свой опыт в решении какой-либо задачи. Но можно многократно делать одно и то же, ничему не научившись на опыте. Гораздо лучше использовать для определения причинных связей информацию, получаемую многими людьми, чем полагаться на личный опыт вместе с его дорого обходящейся необъективностью.

Самопрограммирование

Наука — это не простой сбор фактов; это дисциплина мышления при поисках разумных решений проблем после установления основных фактов, полученных путем наблюдений. Это выдвижение гипотез о возможном на основе известного, а затем попытки проверить эти гипотезы.

Розалин Ялоу (Yalow, 1988)

Известный психолог Роберт Розенталь и его коллега (Rosenthal Fode, 1963) в стандартном курсе экспериментальной психологии предлагали своим студентам обучать крыс проходить через лабиринты. Половине студентов сообщали, что у них крысы специально выведенного вида, с прекрасными способностями к нахождению пути в лабиринтах, а второй половине студентов говорили, что у них крысы специально выведенного вида, неспособные справиться с этой задачей. Как вы, вероятно, уже ожидаете, за короткое время студенты, обучавшие «способных» крыс, достигли гораздо лучших результатов, чем студенты, обучавшие «тупых» крыс. Этот результат особенно интересен тем, что на самом деле между двумя группами крыс не было никаких различий. Розенталь и Фоуд солгали студентам, что крыс выводили специально. Это были обычные лабораторные крысы. Их случайным образом разделили на две группы. Если между крысами в группах не было реальных различий, то как мы объясним тот факт, что студенты, которые верили, что у них «способные» крысы, научили их проходить через лабиринт быстрее, чем студенты из второй группы?

Термин самопрограммирование был введен для обозначения тенденции действовать так, чтобы прийти к ожидаемой цели. Я не знаю, что делали студенты, чтобы быстрее научить крыс из «способной группы» или медленнее — крыс из «тупой» группы. Может быть, способных крыс чаще брали в руки или клали больше пищи на выходе из лабиринта. (Обучая крыс бегать через лабиринт, им дают пищевое вознаграждение, когда они достигают цели, чтобы поддерживать мотивацию.) Может быть, студенты, обучавшие «тупых» крыс, грубо бросали их в лабиринт или не так точно вели записи. Но что бы они ни делали, они каким-то образом так повлияли на результаты эксперимента, что результаты стали соответствовать их ожиданиям.

Если самопрограммирование может влиять на то, как крысы бегают по лабиринтам, то как оно влияет на наше повседневное мышление и поведение? Ранее в этой главе рассматривалось понятие мнимой корреляции, т. е. тенденции верить, что между наблюдаемыми вами событиями существует корреляция, потому что вы считаете, что так должно быть. Психологи находят все больше способов, посредством которых личные убеждения определяют отбор и интерпретацию фактов. Когда вы выступаете в роли «интуитивного ученого», важно иметь в виду те способы, с помощью которых мы влияем на получаемые результаты.

Один из способов устранения влияния самопрограммирования — это метод двойного слепого эксперимента. Давайте рассмотрим пример из области медицины. Существует, наверное, сотня домашних средств от обычной простуды. Как нам решить, какие из них действительно помогают при простуде, и помогают ли эти средства вообще? Возможно, когда-то где-то кто-то дал вам куриный бульон, когда вы были простужены. Несомненно, вам потом стало лучше. Почти всем простуженным со временем становится лучше. Вопрос заключается в том, стало ли вам лучше от куриного бульона. Ответить на него трудно, потому что если вы верите, что от куриного бульона вам становится лучше, вы можете оценить свое состояние как улучшившееся, даже если реального изменения не было. Это просто еще один пример самопрограммирования. Единственный способ проверки этой гипотезы — это дать нескольким людям куриный бульон, а другим — нечто, по виду и вкусу похожее на него, а потом попросить каждую группу оценить свое состояние. В этом примере все испытуемые не знают природы получаемого ими лечения. Важно, чтобы экспериментаторы тоже не знали, кто из испытуемых получил «настоящий» куриный бульон, чтобы случайно не намекнуть им об этом. Эксперименты, в которых ни испытуемые, ни экспериментаторы не знают, кто получает лечение, называются двойными слепыми экспериментами.

Хотя пример с куриным бульоном может показаться несколько натянутым, использование метода двойного слепого эксперимента, совершенно необходимо при проверке эффективности любого лекарства или вида лечения. При официальной лабораторной проверке на эффективность лекарств против СПИДа или рака всегда используется этот метод. Однако большинство людей не применяет его при принятии личных решений о том, например, какой метод психотерапии эффективнее, поможет ли ударная доза витаминов или сможет ли совет хироманта улучшить их жизнь. Перед тем как обратиться к врачу, который обещает излечить вас от диабета путем массажа спины, или заняться «крикотерапией» для повышения уверенности в себе, тщательно проверьте, проводились ли исследования по методу двойного слепого эксперимента, подтвердившие эффективность предлагаемого лечения.

Оккультные верования и паранормальные явления

В основе оккультных верований лежат, вероятно, искаженные СМИ факты, социальная неопределенность и недостатки человеческого мышления.

Барри Сингер и Виктор Бенасси (Singer & Benassi 1981, р. 49)

Верите ли вы в «ясновидение, предсказания, телепатию, экстрасенсорную хирургию, экстрасенсорное целительство, целительные кристаллы, психокинез, астральные путешествия, левитацию, тайну Бермудского треугольника, неопознанные летающие объекты (НЛО), наличие сознания у растений, существование ауры, привидения» (Gray, 1991, р. IX)? Если вы ответили «да» хотя бы один раз, вы не одиноки. При опросе студентов колледжей более 99 % выразили убежденность в существовании минимум одного из этих явлений (Messer Griggs, 1989). Согласно данным института Гэллапа, из 1236 опрошенных американцев 78 % женщин и 70 % мужчин хотя бы изредка читают свои гороскопы (Lister, 1992).

Как мы можем понять эти верования, если не существует убедительных доказательств того, что они имеют какую-либо фактическую основу (Shermer, 1992)? В своих попытках разобраться в происходящих в мире событиях все мы стремимся приписывать им разумные объяснения, особенно если это необычные события. Случалось ли вам подумать о друге, которого вы не видели много лет, а потом услышать его телефонный звонок? Приходилось ли вам изменить свой обычный маршрут по дороге домой с работы или из школы, а потом узнать, что произошел несчастный случай, в который бы вы, вероятно, попали, если бы пошли обычным путем? А как насчет рассказов о людях, которые вылечились от смертельных болезней с помощью мысленных образов? Такие необычные события увлекают нас, и мы пытаемся их понять. Понимаете ли вы, как малые размеры выборки (обычно единственный пример), мнимые корреляции, самопрограммирование, трудности при понимании законов вероятности и другие когнитивные предубеждения способствуют популярности веры в паранормальные явления? Факты говорят о том, что не найдено никаких положительных доказательств существования экстрасенсорных способностей. Существует много рассказов об этом, но еще никогда статистически значимые проявления сверхъестественных сил не были повторены в независимой лаборатории. «Рассказы не делают науки» (Shermer, 1992, р. 19).

В мире много настоящих загадок и много такого, чего мы не можем понять. Возможно, что кто-то нашел неизвестное растительное лекарство от рака или что линии на наших ладонях или расположение чаинок в чашке указывают на важные жизненные события, но если это «реальные» явления, то они должны сохраниться и при ярком свете взаимно закрытой контролируемой лабораторной проверки. Мы можем посмеяться над предсказаниями «экстрасенса» Джин Диксон, которая предрекла, что Джордж Буш будет переизбран, а капуста брокколи станет самым популярным овощем 1990-х гг., или над «экстрасенсом» из Лос-Анджелеса Марией Грасиэтт, которая предсказала, что в мексиканской пустыне будет найдена секретная база НЛО, но необходимо гораздо более скептически относиться к утверждениям вашей подруги о том, что кристаллы обладают целительной силой или что с помощью витамина Е можно оживлять недавно умерших. Эта тема обсуждается также в главе 7, где я рассказываю, как рассуждать с помощью законов вероятности.

Мыслить как интуитивный ученый

На протяжении всей этой главы я проводила мысль о том, что повседневное мышление имеет много общего с исследовательскими методами, используемыми учеными, когда они хотят понять сущность событий, которые изучает их область науки. Многие заблуждения и проблемы, затрудняющие научные исследования, часто встречаются в повседневном мышлении. Если вы поймете некоторые из этих проблем и будете их избегать, то вы будете более грамотно пользоваться чужими исследованиями и сами лучше справитесь с ролью «интуитивного ученого».

Когда вы оцениваете результаты чужих исследований или выдвигаете свои собственные утверждения, следует иметь в виду несколько вопросов:

1. Каков был характер выборки? Достаточно ли она велика? Репрезентативна ли она?

2. Даны ли переменным рабочие определения? Что означают эти термины?

3. Были ли проведенные измерения чувствительными, обоснованными и надежными? Правильно ли проведены сравнения, подтверждающие заключение?

4. Контролировались ли остальные переменные? Как можно по-другому объяснить результаты?

5. Следуют ли данные выводы из проведенных наблюдений?

6. Не используется ли корреляция для поддержки заключения о причинной связи?

7. Рассмотрены ли данные, свидетельствующие о противоположном?

8. Могли ли ожидания экспериментатора вызвать ошибки в интерпретации результатов?

Давайте применим эти рекомендации для выбора программы лечения в примере, приведенном в начале этой главы. Во-первых, чем подтверждается процент успешности лечения? Несмотря на то, что в программе 1 приводится гораздо более высокий процент, чем в программе 2, этими цифрами нельзя пользоваться для сравнения программ, потому что в программе 1 этот процент подсчитан только для тех, кто занимался не менее года, и нет информации о тех, кто бросил занятия, не прозанимавшись и года. Таким образом, приведенный уровень успешности программы 1 не является обоснованной оценкой ее эффективности. У нас также нет информации о том, сколько шансов у человека поправиться вообще без лечения. Другими словами, нет контрольной группы, с которой можно было бы сравнить результаты лечения для определения его эффективности. К сожалению, нет информации о размере выборки, поскольку нам не сообщают, сколько пациентов занимались по каждой из программ. Если бы вам надо было принимать настоящее решение, необходимо было бы запросить всю эту информацию. При имеющейся информации говорить пока не о чем. Я обнаружила, что большинству людей нравится мысль о том, что лечение проводит человек, который сам является бывшим наркоманом и «сам побывал в этой шкуре». Но его компетентность проблематична, поскольку его рассказы о том, что «подействовало на него», могут быть совершенно бесполезными. Доус (Dawes, 1994) очень критично относится к рассуждениям, которые приводят людей к убеждению, что для консультаций лучше всего обратиться к бывшему наркоману. Как отмечает Доус, к таким выводам приводит примерно следующий ход мысли:

Консультант был наркоманом.

Он сделал X и излечился.

Если я сделаю X, то я тоже излечусь.

Надеюсь, вы видите, что это очень слабое доказательство. Если вы уже прочитали главу 4, в которой говорится о рассуждениях, вы узнали в этом доказательстве категорический силлогизм — и можете убедиться, что заключение не является валидным. Кроме того, обоснованием утверждения служит опыт одного индивидуума (размер выборки равен единице), в нем сказывается необъективность памяти, отсутствует независимая проверка полезности X, встают проблемы мнимой корреляции и многие другие. Конечно, не исключено, что этот индивидуум отличный психотерапевт, но судя по предоставленной вам информации ожидать этого нет причин. С другой стороны, консультант, который изучал психологические и биологические особенности наркомании, должен знать различные способы лечения, теории, объясняющие возникновение наркотической зависимости, и, что самое главное, уровни успешности различных способов лечения. Это очень важный момент. Попробуйте задать вопрос, приведенный в начале главы, своим друзьям и родственникам. Вы, вероятно, обнаружите, что они склонны выбрать в качестве консультанта излечившегося наркомана.

Если вы внимательно исследуете свои собственные заключения и выводы, сделанные другими людьми, с точки зрения принципов проверки гипотез, то вы сможете оградить себя от необоснованных утверждений и усовершенствовать свою способность делать разумные выводы из наблюдений.

Применение алгоритма

При применении алгоритма мышления для проверки гипотез рассмотрите следующие вопросы.

1. Какова цель? Вам следует использовать навыки, выработанные в этой главе, всякий раз, когда вы выдвигаете гипотезу о связях между событиями, а затем собираете наблюдения для проверки истинности вашей гипотезы. Существует огромное количество примеров областей применения этих навыков. Их следует использовать при рассмотрении социальных взаимоотношений (например, «Ей нравится, когда я делаю ей комплименты»), физических зависимостей (например, «Ртуть в трубочке поднимается при увеличении температуры»), эффективности лечения (например, «Смехотерапия может способствовать выздоровлению от некоторых серьезных болезней») и при использовании результатов чужих исследований.

2. Что известно? Этот вопрос касается планирования процесса мышления. Когда вы мыслите как «интуитивный ученый», вам необходимо начать с четкого определения того, какую природу имеет проверяемая вами гипотеза и как вы будете проводить наблюдения. Вам также необходимо рассмотреть относительную опасность различного рода ошибок. Вам известно, как вы собираетесь оперировать своими переменными и какая необходима степень уверенности для того, чтобы решить, что ваша гипотеза верна. Короче говоря, на этом этапе конкретизируется отправная точка мыслительного процесса. При определении причин один из важнейших вопросов касается того, случайным ли образом испытуемые распределялись по различным «группам воздействия». Если это не так, чрезвычайно трудно обоснованно утверждать о наличии причинных связей.

3. Какие навыки мышления позволят вам достичь поставленной цели? Выбор соответствующих навыков зависит от того, как вы ответили на предыдущие вопросы. Если гипотеза, по вашему мнению, настолько важна, что требует формальной проверки, то необходимо составить репрезентативную выборку и обеспечить наличие достаточно большого количества испытуемых и проведение точных измерений. Конечно, я не ожидаю, что вы будете испытывать смертельно ядовитые лекарственные вещества с помощью методики проверки гипотез, предложенной в этой главе. Такого рода испытания должны проводить ученые, имеющие обширные знания в области планирования исследований и экспериментов. Но вы должны уметь пользоваться результатами подобных исследований и искать в них данные, подтверждающие применение правильных методов проверки гипотез.

Чтобы мыслить как «интуитивный ученый», необходимо иметь следующие навыки:

• Осознание необходимости формулировки рабочих определений и их применение.

• Понимание необходимости изоляции и контроля переменных для установления сильных причинных связей.

• Проверка адекватности размера выборки и ее репрезентативности при обобщении результатов.

• Способность описать связь между любыми двумя переменными как положительную или отрицательную или признать ее отсутствие.

• Понимание ограничений, связанных с корреляционным рассуждением.

• Стремление к конвергентной валидности для усиления своей уверенности в решении.

• Проверка наличия и понимание необходимости контрольных групп.

• Осознание того, что при оценке вариативности почти всегда присутствует необъективность.

• Учет степени «вредности» ошибок различных типов.

• Умение определить, как самопрограммирование может влиять на результаты экспериментов и повседневные наблюдения.

• Понимание, когда можно и когда нельзя говорить о наличии причинной связи. Эти навыки следует использовать при мышлении и при критическом подходе к мышлению других людей. После чтения данной главы вы должны уметь применять эти навыки в любом контексте, в котором они необходимы.

4. Достигнута ли поставленная цель? Последний вопрос, который надо рассмотреть, — это удалось ли вам уменьшить неопределенность: можете ли вы предсказать результаты определенных действий или принять более обоснованные решения с помощью навыков проверки гипотез, предложенных в этой главе? Тщательная забота о точности всегда является окончательной проверкой качества принятого вами решения. Когда вы действуете как «интуитивный ученый», вы иногда будете принимать неправильные решения, потому что мы никогда не знаем «истины». Но путем аккуратного применения методики проверки гипотез, представленной в этой главе, вы можете свести число неправильных решений к минимуму.

Краткий итог главы

1. Большая часть нашего повседневного мышления похожа на научный метод проверки гипотез. Мы формулируем представления о мире и собираем наблюдения, чтобы решить, верны ли наши представления.

2. При применении индуктивного метода мы выдвигаем гипотезы на основе своих наблюдений. При применении дедуктивного метода мы накапливаем наблюдения, которые либо подтверждают, либо опровергают наши гипотезы. Как правило, при мышлении эти два процесса переплетаются, так что мы разрабатываем гипотезы^, основываясь на опыте, проводим наблюдения, а затем на основе этих наблюдений переопределяем свои гипотезы.

3. Рабочие определения — это точные формулировки, которые позволяют идентифицировать и измерять переменные.

4. По независимым переменным мы предсказываем или объясняем поведение зависимых переменных. При выдвижении гипотез мы хотим выяснить, как независимая переменная влияет на зависимую переменную (или переменные).

5. При выведении заключений из своих наблюдений важно использовать выборки достаточно большого размера, потому что люди реагируют по-разному. Большинство проявляет чрезмерную склонность к обобщениям результатов, полученных на малых выборках.

6. Для того чтобы установить, что одна переменная (например, курение) приводит к появлению другой переменной (например, рака легких), необходимо изолировать и контролировать переменные, между которыми предполагается причинная связь. Для того чтобы сделать строгий вывод о наличии причинной связи, необходима трехступенчатая схема проведения эксперимента, которая была описана в этой главе.

7. В контексте повседневного мышления мы часто пользуемся ретроспективными методами для установления причин, вызвавших появление события. Эти методы обладают недостатками, связанными с селективностью и уступчивостью памяти и с отсутствием систематических наблюдений за причиной. Для установления причинно-следственных связей лучше пользоваться проспективной методикой, когда события записывают в момент их наступления, а затем выясняют, последуют ли гипотетические результаты.

8. Переменные, которые соотносятся между собой таким образом, что изменениям одной переменной сопутствуют изменения другой переменной, называются коррелирующими переменными. Корреляция может быть положительной, как связь между ростом и весом человека (люди более высокого роста, как правило, весят больше, в то время как люди маленького роста обычно весят меньше), или отрицательной, как связь между физической нагрузкой и весом (люди, которые много тренируются, склонны к худобе, а те, кто мало тренируется, склонны к полноте).

9. Широко распространена ошибка, когда корреляцию между переменными принимают за причинную связь. Существуют различные возможности: переменная А является причиной переменной В; или переменная В является причиной переменной А; или переменные А и В влияют друг на друга; или и А, и В вызваны какой-то третьей переменной.

10. Ошибки еще одного типа, часто встречающиеся в человеческих рассуждениях, возникают тогда, когда считают, что между двумя переменными существует корреляция, в то время как на самом деле ее нет (мнимая корреляция).

11. Важно, чтобы ваши измерения были чувствительными, валидными и надежными, в противном случае выводы могут оказаться неверными. Очень немногие люди учитывают важность проблем, связанных с измерениями, когда делают повседневные выводы о природе окружающего мира.

12. Несмотря на то, что многие наши суждения необоснованны, люди испытывают в них глубокую уверенность. Это явление называется мнимой валидностью.

13. Сами того не желая, мы можем действовать таким образом, что придем к подтверждению или опровержению гипотезы в соответствии со своими ожиданиями. Это называется самопрограммированием.

Термины для запоминания

Проверьте, насколько хорошо вы разобрались в понятиях, представленных в этой главе, перечитав их определения. Если окажется, что какой-то термин вызывает у вас затруднения, обязательно перечитайте раздел, в котором он обсуждается.

(А) Переменная. Измеримая характеристика, которая может принимать более одного значения (например, рост, пол, возраст, раса).

Валидность. Показывает, измеряет ли оценка (например, тест) именно то, что вы хотите измерить.

Выборка. Подгруппа контингента, которая изучается для того, чтобы сделать выводы обо всем контингенте.

Гипотеза. Набор представлений о природе мироздания, обычно касающихся связи между двумя или несколькими переменными.

Двойной слепой эксперимент. Разновидность эксперимента, когда ни испытуемые, ни лица, собирающие данные, не знают, к какой группе воздействия относится испытуемый.

Дедуктивный метод. Метод формулирования гипотез, при котором вы формулируете гипотезу, которую считаете истинной, а затем выводите из нее следствия. Затем проводятся систематические наблюдения для проверки правильности вашей гипотезы.

Зависимая переменная. Переменная, значение которой измеряется при эксперименте, чтобы определить, зависит ли оно от значения независимой переменной. Сравните с независимой переменной.

Закон малых чисел. Готовность поверить, что результаты, полученные для нескольких испытуемых, можно обобщать на весь контингент.

Изменчивость. Термин для обозначения того факта, что все люди (и животные) по-разному реагируют на экспериментальные раздражители.

Индуктивный метод. Метод формулирования гипотез, при котором вы наблюдаете события, а затем выдвигаете гипотезу об этих событиях.

Испытуемый. Человек, животное или организм, который участвует в эксперименте.

Конвергентная валидность. Использование нескольких различных оценок или методов, которые все приводят к одному заключению.

Контингент. В терминологии статистики и проверки гипотез контингент — это вся группа людей (животных или организмов), которые вас интересуют и на которую вы хотите обобщать результаты.

Корреляция между переменными. Существование связи между двумя или несколькими переменными. См. положительную и отрицательную корреляции.

Мнимая валидность. Уверенность в том, что оценка валидна (т. е. измеряет именно то, что вам надо), тогда как на самом деле это не так. Из-за этого явления люди испытывают излишнюю уверенность в своих суждениях.

Мнимая корреляция. Убеждение о корреляции двух переменных, когда на самом деле такой корреляции нет.

Надежность. Постоянство оценки (например, теста) при повторении измерения.

Независимая переменная. Переменная, которую при проверке гипотезы экспериментатор выбирает (или оперирует ею), чтобы выяснить, приведут ли изменения независимой переменной к изменениям зависимой переменной. Например, если вы хотите узнать, с помощью чего легче убедить людей — с помощью угроз или с помощью разумных обращений, — то вы можете обратиться к одной группе людей с угрозами, а к другой — с разумными призывами (независимой переменной является тип обращения), а затем определить, насколько изменилось их отношение к данной теме (зависимая переменная).

Нерепрезентативная выборка. Выборка, не являющаяся репрезентативной для населения, из которого она была отобрана.

Обобщение. Использование результатов, полученных на выборке, для заключения о том, что если бы был обследован весь контингент, то были бы получены аналогичные результаты. (При использовании в контексте решения задач обобщение означает стратегию, в которой проблема рассматривается как пример более широкого класса задач.)

Отрицательная корреляция. Связь между двумя или несколькими переменными, при которой увеличению одной переменной сопутствует уменьшение другой.

Положительная корреляция. Связь между двумя или несколькими переменными, при которой увеличению одной переменной сопутствует увеличение другой и уменьшение одной переменной происходит одновременно с уменьшением другой.

Проверка гипотезы. Научный метод накопления наблюдений для подтверждения или опровержения представлений о связях между переменными.

Проспективные исследования. Метод проведения исследований, когда факторы, являющиеся возможными причинами события, определяются до того, как оно произошло. Затем экспериментаторы определяют, произойдет ли гипотетическое событие.

Рабочее определение. Четко сформулированный набор процедур, объясняющих читателю, как распознать и оценить интересующее его понятие.

Размер выборки. Количество людей, выбранных для проведения исследования.

Репрезентативная выборка. Выборка, пропорциональная контингенту по значимым показателям, таким как соотношение между количеством мужчин и женщин, социоэкономический статус и возраст и т. п.

Ретроспективные исследования. После того как событие произошло, экспериментатор исследует прошлое, чтобы определить причину этого события.

Самопрограммирование. Склонность действовать таким образом, который влияет на экспериментальные результаты так, что мы получаем результаты, соответствующие нашим ожиданиям.

Случайная выборка. Выборка, куда с одинаковой вероятностью может попасть любой человек из контингента.

Смешанное влияние факторов (confounding). Когда экспериментальные группы отличаются по нескольким показателям, невозможно выделить влияние каждой из переменных. Например, если вы обнаружили, что девочки-подростки получают более высокие результаты при тестировании вербальных способностей, чем мальчики в возрасте до 12 лет, то вы не поймете, связаны ли эти различия в вербальных способностях с половыми или с возрастными различиями между группами.

Удобные выборки. Группы людей, используемые в качестве выборки, которые легко доступны как участники эксперимента. Такие выборки могут не быть репрезентативными для контингента, из которого они отобраны.

Чувствительность измерений. Возможность при измерениях определить небольшие изменения зависимой переменной.

Загрузка...