<<
>>

Сноски

1

Хоумран – удар в бейсболе, при котором мяч перелетает через все игровое поле; дает право совершить перебежку по всем базам и принести своей команде очко. Прим. перев.

2

Куортербек – распасовщик, играющий помощник тренера в американском футболе.

Прим. перев.

3

Тачдаун – в американском футболе: пересечение мячом или игроком с мячом линии зачетного поля соперника. Прим. перев.

4

Коэффициент Джини иногда умножают на 100, чтобы он выражался целым числом. В таком случае для Соединенных Штатов он равнялся бы 45.

5

Netflix – американская компания, поставщик фильмов и сериалов на основе потокового мультимедиа. Прим. перев.

6

Исторически так сложилось, что слово «данные» (data) используется во множественном числе (например, «эти данные являются весьма обнадеживающими»). Это слово можно употреблять и в единственном числе: «данное» (datum); в этом случае речь идет о каком-то отдельно взятом элементе данных (например, ответ одного человека на какой-то один вопрос анкеты, используемой при опросе общественного мнения).

Употребление слова «данные» во множественном числе сигнализирует каждому, кто занимается серьезными исследованиями, о том, что вы знаете толк в статистике. С учетом сказанного многие специалисты по грамматике, а также многие издания, такие как The New York Times, в настоящее время согласны с тем, что слово «данные» может означать как единственное, так и множественное число, как свидетельствует приведенная мной цитата из The New York Times.

7

Scholastic Aptitude Test – стандартизированный тест для поступающих в американские высшие учебные заведения. Прим. ред.

8

Разумеется, я заведомо упрощаю здесь многогранные и чрезвычайно сложные проблемы, которые ставит перед нами медицинская этика.

9

В российском прокате этот фильм вышел под названием «Человек, который изменил все».

Фильм снят по книге Майкла M. Льюиса, изданной в 2003 году, о бейсбольной команде «Окленд Атлетикс» и ее генеральном менеджере Билли Бине. Его цель – создать конкурентоспособную бейсбольную команду, несмотря на отсутствие больших финансовых возможностей. Главную роль исполняет Брэд Питт. Прим. перев.

10

После того как в баре оказалось бы двенадцать посетителей, медианой была бы средняя точка между доходом посетителя, сидящего на шестом стуле, и доходом посетителя, сидящего на седьмом стуле. Поскольку доход того и другого составляет 35 000 долларов, медиана равняется 35 000 долларов. Если бы доход одного из них равнялся 35 000, а доход другого – 36 000, то медиана для этой группы в целом равнялась бы 35 500 долларов.

11

«Лимонами» на американском сленге называют устройства с дефектами, которые проявляются уже после покупки. Прим. ред.

12

Вот что удалось выяснить в ходе дальнейшего исследования проблемы. Оказалось, что почти все бракованные принтеры производились на заводе в Кентукки, где рабочие разобрали часть сборочного конвейера, чтобы создать подпольное предприятие по изготовлению виски. Постоянно пьяные рабочие и частично разобранный сборочный конвейер стали причиной резкого ухудшения качества выпускаемых заводом принтеров.

13

Интересно отметить, что этот менеджер – один из тех десяти парней с годовым доходом 35 000 долларов, которые сидели в баре, когда туда вошел Билл Гейтс с говорящим попугаем на плече. Причуды судьбы!

14

Марк Твен приписывал эти слова британскому премьер-министру Бенджамину Дизраэли; впрочем, каких-либо документальных свидетельств, подтверждающих авторство Дизраэли, не обнаружено.

15

См. на сайте http://www.bls.gov/data/inflation_calculator.htm.

16

SAT (Scholastic Aptitude Test) – тест на умение грамотно излагать свои мысли в устной форме и тест математических способностей, используемые при поступлении в американские колледжи. Прим. перев.

17

ACT (American College Testing) – стандартизированный тест для поступления в колледжи и университеты США.

Прим. перев.

18

Netflix – американская компания, поставщик фильмов и сериалов на основе потокового мультимедиа. Прим. перев.

19

Я имею в виду «человека Шести Сигм». Строчной буквой греческого алфавита σ (сигма) обозначается среднеквадратическое отклонение. «Человек Шести Сигм» – это шесть среднеквадратических отклонений сверх нормы, выраженной в таких понятиях, как статистическая возможность, сила и ум.

20

Для всех этих подсчетов я воспользовался очень удобным биномиальным онлайн-калькулятором с сайта http://stattrek.com/Tables/Binomial.aspx.

21

Агентство НАСА также предупреждало граждан о том, что даже фрагменты упавшего на Землю спутника являются собственностью государства. Таким образом, каждый, кто найдет и спрячет их у себя (например для коллекции), будет считаться нарушителем закона – даже если найдет их в своем дворе.

22

Левитт С., Дабнер С. Фрикономика. – М.: Манн, Иванов и Фербер, 2010.

23

Левитт и Дабнер рассуждали примерно так. Каждый год тонут приблизительно 550 детей в возрасте до десяти лет, а 175 детей в возрасте до десяти лет погибают в результате неосторожного обращения с оружием. Левитт и Дабнер взяли за основу следующие коэффициенты смертности: один утонувший ребенок на каждые 11 000 плавательных бассейнов в сравнении с одним смертельным случаем в результате неосторожного обращения с оружием на каждые «миллион с хвостиком» единиц огнестрельного оружия. Что касается подростков, то указанные коэффициенты могут быть совершенно другими, во-первых, поскольку подростки лучше плавают и, во-вторых, могут гораздо чаще быть виновниками трагедии, если у них в руках случайно окажется огнестрельное оружие. Однако в моем распоряжении нет соответствующих данных.

24

Существует шесть способов выбросить 7 при подбрасывании двух игральных костей: (1,6); (2,5); (3,4); (6,1); (5,2) и (4,3) и лишь два способа выбросить 11: (5,6) и (6,5).

Между тем есть 36 возможных вариантов результата подбрасывания двух игральных костей: (1,1); (1,2); (1,3); (1,4); (1,5); (1,6).

И (2,1); (2,2); (2,3); (2,4); (2,5); (2,6). И (3,1); (3,2); (3,3); (3,4); (3,5); (3,6). И (4,1); (4,2); (4,3); (4,4); (4,5); (4,6). И (5,1); (5,2); (5,3); (5,4); (5,5); (5,6). И наконец, (6,1); (6,2); (6,3); (6,4); (6,5) и (6,6).

Следовательно, вероятность выпадания 7 или 11 равняется количеству возможных способов выбросить любое из этих двух чисел, деленное на общее количество возможных вариантов при подбрасывании двух игральных костей, то есть 8/36. Между прочим, значительная часть ранних исследований вероятности выполнялась именно любителями азартных игр в попытках точно определить свои шансы.

25

Полное математическое ожидание для однодолларового билета мгновенной лотереи в штате Иллинойс (округленное до ближайшего цента) подсчитывается следующим образом: 1/15?($2) + 1/42,86?($4) + 1/75?($5) + 1/200?($10) + 1/300?($25) + 1/1589?($50) + 1/8000?($100) + 1/16 000?($200) + 1/48 000?($500) + 1/40 000?($1000) = $0,13 + $0,09 + $0,07 + $0,05 + $0,08 + $0,03 + $0,01 + $0,01 + $0,01 + $0,03 = $0,51. Однако существует также шанс 1/10 получить в качестве выигрыша бесплатный лотерейный билет; ожидаемый доход этого варианта составляет 0,51 доллара; таким образом, ожидаемый доход в целом равняется $0,51 + 0,1?($0,51) = $0,51 + $0,05 = $0,56.

26

Строго говоря, для правильного подсчета математического ожидания необходимо, чтобы сумма вероятностей всех возможных исходов равнялась 1. Здесь же сумма вероятностей представленных исходов составляет 0,2659. Однако, если принять, что с вероятностью 1–0,2659 = 0,7341 выпадает билет без всякого выигрыша (то есть выигрыш равен 0), тогда математическое ожидание подсчитано правильно. Прим. ред.

27

Ранее в этой книге я привел пример, в котором упоминалось о нетрезвых работниках, выпускающих бракованные лазерные принтеры. Выбросьте его из головы: будем исходить из того, что компания, выпускающая лазерные принтеры, уже решила проблемы с качеством.

28

Так как я советовал вам с осторожностью относиться к описательным статистикам, я чувствую себя обязанным отметить, что автомобиль, который угоняют чаще всего, вовсе не обязательно является автомобилем, который угоняют вероятнее всего. Большое число автомобилей марки Honda Civic угоняют именно потому, что это самая распространенная марка, между тем как вероятность угона какого-либо отдельно взятого автомобиля марки Honda Civic (а именно это интересует страховые компании, страхующие от угона автомобилей) может оказаться весьма низкой. Напротив, даже если угоняют 99 % всех автомобилей Ferrari, автомобиль этой марки не возглавил бы список «наиболее часто угоняемых», поскольку таких автомобилей сравнительно мало и, следовательно, их угоняют довольно редко.

29

Вы можете сыграть в эту игру на сайте http://www.nytimes.com/2008/04/08/science/08monty.html?_r=2&oref=slogin&oref=slogin.

30

Издана на русском языке: Талеб Н. Черный лебедь. Под знаком непредсказуемости. – М.: КоЛибри, 2009.

31

СВСМ по-прежнему остается медицинской загадкой, хотя многие из факторов риска, связанных с этим феноменом, удалось выявить. Например, смертность у младенцев можно резко снизить, если ребенка укладывать спать на спину.

32

Вместе с тем в теории вероятностей доказан факт, что если достаточно долго подбрасывать монету, то будут наблюдаться периоды преобладания выпадания орла или решки. Это так называемый первый закон арксинуса. Этот закон не отменяет сказанного автором, а только показывает структуру исходов в испытаниях Бернулли. О данном феномене см., например, классическую книгу В. Феллер. Введение в теорию вероятностей и ее приложения. Т. 1. Глава III. Прим. ред.

33

Chicago Cubs – профессиональный бейсбольный клуб, выступающий в Центральном дивизионе Национальной бейсбольной лиги. Прим. перев.

34

Указанное изменение политики Еврокомиссии было в конечном счете разъяснено в особом постановлении Верховного суда Евросоюза от 2011 года. В этом постановлении было указано, что применение разных надбавок к мужчинам и женщинам представляет собой дискриминацию по половому признаку.

35

Известный принцип программирования, в соответствии с которым неверные входные данные не могут привести к правильному результату. Прим. перев.

36

На тот момент средняя продолжительность этой болезни составляла сорок три дня со среднеквадратическим отклонением, равным двадцати четырем дням.

37

Standard & Poor’s 500 – показательный пример того, что может и должен делать любой индекс. Этот индекс составлен из цен акций 500 ведущих американских компаний с учетом рыночной стоимости каждой из этих компаний (так, чтобы более крупные компании имели в этом индексе больший вес, чем мелкие). Данный индекс – простой и точный показатель того, что происходит с ценами акций крупнейших американских компаний в любой момент времени.

38

С очень интересным обсуждением того, почему следует отдать предпочтение покупке индексных фондов, вместо того чтобы пытаться превзойти рынок, можно ознакомиться в книге моего бывшего преподавателя, профессора Бертона Малкиела (Burton Malkiel) A Random Walk Down Wall Street (Случайная прогулка по Уолл-стрит. – Минск: Попурри, 2006).

39

Леброн Рэймон Джеймс (LeBron Raymone James) – американский профессиональный баскетболист, играющий на позиции легкого и тяжелого форварда за команду НБА «Кливленд Кавальерс». Прим. перев.

40

Обратите внимание на весьма остроумное использование в данном случае ложной точности.

41

Когда среднеквадратическое отклонение соответствующей совокупности вычисляется на основании меньшей выборки, приведенная нами формула несколько видоизменяется: SE = s ÷ √(n − 1). Это помогает учесть то обстоятельство, что дисперсия в малой выборке может «недооценивать» дисперсию всей совокупности. Это не имеет особого отношения к более универсальным положениям, о которых идет речь в данной главе.

42

Мой коллега из Чикагского университета, Джим Сэлли, сделал очень важное критическое замечание по поводу примеров с пропавшим автобусом. Он указал, что пропавший автобус – чрезвычайно большая редкость в наше время. Поэтому если нам придется искать какой-нибудь пропавший автобус, то любой встретившийся нам автобус, который окажется пропавшим или поломавшимся, наверняка будет именно тем автобусом, который нас интересует, каким бы ни был вес пассажиров в этом автобусе. Пожалуй, Джим прав. (Воспользуюсь такой аналогией: если вы потеряли в супермаркете своего ребенка и дирекция этого магазина сообщает по радио, что возле кассы номер шесть стоит чей-то потерявшийся ребенок, то вы наверняка сразу же решите, что речь идет именно о вашем ребенке.) Следовательно, нам не остается ничего другого, как дополнить наши примеры еще одним элементом абсурда, полагая, что пропажа автобуса является вполне рядовым событием.

43

С точки зрения семантики мы еще не доказали, что нулевая гипотеза истинная (то есть что лечение заключенных от наркозависимости не имеет никакого эффекта). Такое лечение может оказаться чрезвычайно эффективным для какой-либо другой группы заключенных. Или, возможно, в этой подопытной группе значительно большее число заключенных совершили бы повторные преступления, если бы не прошли курс лечения от наркозависимости. В любом случае на основе собранных данных нам просто не удалось отвергнуть нулевую гипотезу. Существует аналогичная разница между «неспособностью отвергнуть» нулевую гипотезу и ее принятием. Сам по себе факт, что одному исследованию не удалось опровергнуть утверждение о том, что лечение от наркозависимости не помогает предотвратить повторный арест, еще не означает, что мы должны согласиться с тем, что лечение от наркозависимости бесполезно. С точки зрения статистики здесь имеет место существенная разница. С учетом сказанного следует отметить, что подобные исследования зачастую проводятся с целью информирования полиции, и тюремная администрация, которой приходится решать, как правильно распределить ресурсы, может считать лечение от наркозависимости неэффективным инструментом до тех пор, пока не убедится в обратном. В этом случае, как и в других при использовании статистических данных, следует полагаться на здравый смысл.

44

В статистике уровнем значимости называют вероятность отклонить нулевую гипотезу при условии, что она истинна. Это так называемая ошибка первого рода. Об этой ошибке см. далее. Прим. ред.

45

Этот пример навеян реальными событиями. Понятное дело, многие подробности изменены исходя из соображений национальной безопасности. Что же касается меня, то я не могу ни подтвердить, ни отрицать в них своего участия.

46

Точнее говоря, 95 % средних значений всех выборок будут находиться в пределах 1,96 стандартной ошибки выше или ниже среднего значения совокупности.

47

Существуют две возможные альтернативные гипотезы. Первая заключается в том, что профессиональные баскетболисты выше, чем мужское население в целом. Вторая – что средний рост профессиональных баскетболистов отличается от среднего роста мужского населения в целом (при этом не будем забывать о вероятности того, что рост профессиональных баскетболистов может в действительности быть меньшим, чем у некоторых обычных мужчин). Это различие не играет большой роли при выполнении проверки по критерию значимости и вычислении p-значения. Соответствующее объяснение можно найти в более подробных учебниках по статистике, однако это не играет особой роли для нашего обсуждения, имеющего более общий характер.

48

Сознаюсь, что однажды в отчаянии я изорвал одну книгу по статистике.

49

Еще одним ответом могла бы стать попытка повторить полученные результаты в дополнительных исследованиях.

50

Ошибка второго рода – это вероятность принятия нулевой гипотезы тогда, когда она неверна. Прим. ред.

51

Согласно сайту движения Occupy Wall Street, это народное движение, которое возникло 17 сентября 2011 года в Либерти-сквер, финансовый округ Манхэттена, и распространилось на более чем 100 городов Соединенных Штатов, а также инициировало акции протеста в более чем 1500 городах по всему миру. Occupy Wall Street выступает против засилья крупных банков и транснациональных корпораций, оказывающих разлагающее влияние на демократический процесс, и против роли Уолл-стрит в создании экономического коллапса, который породил тяжелейшую рецессию за все время существования человечества. Это движение вызвано народными волнениями в Египте и Тунисе и ставит своей задачей показать, как 1 % самых богатых людей диктуют правила несправедливой глобальной экономики, которая становится непреодолимым препятствием на нашем пути в будущее.

52

Можно ожидать, что истинный процент голосов избирателей, отданных за кандидата от республиканцев, окажется за пределами доверительного интервала экзитпола приблизительно в 5 случаях из 100. В таких случаях истинный процент голосов избирателей, отданных за кандидата республиканцев, окажется меньше 50 % или больше 54 %. Если, однако, он получит больше 54 % голосов избирателей, ваша телекомпания не ошибется, назвав его победителем (просто его победа окажется еще более убедительной, чем вы предсказывали). Таким образом, вероятность того, что проведенный вами экзитпол заставит вас ошибочно объявить победителем кандидата-республиканца, составляет лишь 2,5 %.

53

Неравенство стандартных ошибок здесь обусловлено наличием третьего, «независимого» кандидата и, соответственно, процентом избирателей, отдавших ему свои голоса. Если было бы только два кандидата, то стандартные ошибки для каждого из них были бы всегда равны. Прим. ред.

54

Формула для вычисления стандартной ошибки опроса, которую я использовал в данном случае, предполагает, что опрос проводится в произвольной выборке из соответствующей совокупности. Организации, специализирующиеся на проведении опросов общественного мнения, могут отходить от этого метода проведения выборочных исследований; в таком случае формула для вычисления стандартной ошибки опроса также несколько изменяется. Однако базовая методика остается той же.

55

По-видимому, самое простое доказательство, что функция f(p) = p(1 − p) = p − p? принимает максимальное значение при р = 0,5, – это математическое доказательство. Находим производную f′(p) = 1 − 2p, приравниваем ее к нулю и получаем уравнение 1 − 2p = 0. Решением этого уравнения будет р = 0,5. Что и требовалось доказать. (О том, что это максимум, свидетельствует вторая производная f″(p) = −2.) Прим. ред.

56

Согласно Международному своду сигналов, поднятый желтый флаг означает карантин. Таким образом автор предостерегает читателя об «опасности» дальнейшего текста, где описывает возможные «ловушки» регрессионного анализа. Прим. ред.

57

Это упражнение следует рассматривать как «игру с данными», а вовсе не как заслуживающее доверия исследование каких-либо зависимостей, описанных в последующих уравнениях регрессии. Наша цель – предоставить читателям интуитивно понятный пример того, как «работает» регрессионный анализ, а не выполнить строго научное исследование, касающееся веса американцев.

58

«Параметр» – это термин, обозначающий любую статистику, которая описывает ту или иную характеристику какой-либо совокупности; средний вес для всех взрослых мужчин – параметр соответствующей совокупности. То же можно сказать о среднеквадратическом отклонении. В приведенном примере истинная связь между ростом и весом для данной совокупности является параметром этой совокупности.

59

Когда нулевая гипотеза заключается в том, что коэффициент регрессии равняется нулю (а это имеет место в большинстве случаев), отношение наблюдаемого коэффициента регрессии к стандартной ошибке называется t-статистикой. Это также объясняется в приложении к данной главе.

60

В статистике этот показатель называется коэффициентом детерминации. Прим. ред.

61

Квинтиль – это квантиль порядка 0,2. Если выборочные значения организовать в порядке возрастания, то квинтили делят эту выборку на пять равных (по количеству) частей. В данном случае «нижний квинтиль склонности к регулярным занятиям спортом» – это группа наименее склонных к регулярным занятиям спортом, составляющая пятую часть из совокупности лиц, регулярно им занимающихся. Прим. ред.

62

Более широкие силы дискриминационного характера могут влиять на выбор женщинами той или иной служебной карьеры или на тот факт, что женщинам гораздо чаще, чем мужчинам, приходится брать отпуск по уходу за детьми. Однако эти важные вопросы не следует путать с более узким вопросом, платят ли женщинам меньше, чем мужчинам, за одну и ту же работу.

63

Эти исследования несколько отличаются от уравнений регрессии, о которых рассказывалось выше в настоящей главе. В этих исследованиях интересующий нас исход, или независимая переменная, являются двоичными. За время исследования у его участника либо возникло то или иное заболевание сердца, либо нет. Таким образом, исследователи используют инструмент под названием многомерная логистическая регрессия. Основополагающая идея остается такой же, как и в случае обычных моделей наименьших квадратов, описанных в настоящей главе. Каждый коэффициент выражает влияние конкретной объясняющей переменной на зависимую переменную при неизменности влияния других переменных в данной модели. Ключевая разница заключается в том, что все переменные в нашем уравнении влияют на вероятность наступления некоторого события, например на вероятность сердечного приступа за период проведения исследования. Например, в этом исследовании вероятность возникновения за период его проведения каких-либо проблем с сердцем у работников, входящих в состав контрольной группы с низкими должностями, в 1,99 раза выше, чем у работников, входящих в состав контрольной группы с высокими должностями, после фиксации всех остальных «сердечных факторов риска».

64

Степень свободы и в русской статистической литературе обозначается как df (от англ. degrees of freedom). См. ниже в Приложении диаграмму. Прим. ред.

65

Для тех, кто еще не догадался: t-распределение – это распределение Стьюдента. В русской литературе чаще всего оно называется именно так. Прим. ред.

66

Более общая формула для вычисления t-статистики имеет следующий вид: tb = (b − b0) ÷ SEb, где b – наблюдаемый коэффициент, b0 – нулевая гипотеза для этого коэффициента, а SEb – стандартная ошибка для наблюдаемого коэффициента b.

67

Чтобы приспособить регрессионный анализ для использования данных с нелинейными связями, существуют более сложные методы. Однако прежде чем их применять, вам нужно уяснить, почему использование обычного метода наименьших квадратов с нелинейными связями лишено смысла.

68

Необходимо уточнить, что метод наименьших квадратов (МНК), который автор объявил основой регрессионного анализа, действительно можно использовать только для линейных уравнений регрессии. Но линейных относительно коэффициентов регрессии, а не переменных. Поэтому МНК вполне можно применять и для нелинейных (по переменным) уравнений регрессии, которые, однако, являются линейными относительно коэффициентов регрессии либо становятся таковыми после преобразований. Также отметим, что в арсенале регрессионного анализа есть методы, отличные от МНК, которые предназначены для нахождения коэффициентов регрессии в существенно нелинейных уравнениях. Прим. ред.

69

Проще говоря (так, как принято в этой книге), мультиколлинеарность заключается в наличии сильной линейной (статистической) зависимости внутри некоторой группы объясняющих переменных. Это порождает вычислительные сложности или вообще невозможность рассчитать коэффициенты функции регрессии. Прим. ред.

70

Еще одной проблемой «лишних» переменных является мультиколлинеарность (описанная выше), вероятность которой резко возрастает при внесении в уравнение регрессии дополнительных переменных, не прошедших специальной проверки. С другой стороны отметим, что в регрессионном анализе развиты средства отбраковки лишних незначимых объясняющих переменных. Простейшим из которых является так называемый скорректированный коэффициент детерминации, рассчитываемый на основе параметра R?. Прим. ред.

71

Русский аналог этой телевикторины называется «Своя игра». Прим. перев.

72

В оригинале приведено слово treatment, которое имеет множество значений. Эти значения: обработка, решение, лечение, трактовка, активизация и др. Мы выбрали слово «активирование» как наиболее подходящее по смыслу для использования в данном тексте. Прим. ред.

73

Эспланада – отрезок музейно-парковой зоны в центре Вашингтона между Капитолием и памятником Джорджу Вашингтону. Прим. перев.

74

Участники этого эксперимента знали, что участвуют в клиническом испытании и что им могут сделать фиктивную хирургическую операцию.

75

В Соединенных Штатах в подготовительных школах учатся дети пяти-шести лет. Прим. перев.

76

Исследователям нравится слово «воспользоваться» (exploit). Оно, в частности, применяется в значении «воспользоваться какой-либо возможностью, связанной с данными». Например, когда исследователи обнаруживают какой-либо натурный эксперимент, который создает подопытную и контрольную группу, они пишут, как собираются «воспользоваться разбросом в соответствующих данных».

77

Здесь существует вероятность ошибки. Обе группы студентов достаточно талантливы для того, чтобы быть принятыми в один из элитных колледжей или университетов. Однако одна группа студентов решила поступить в элитное учебное заведение, а другая предпочла менее престижный колледж или университет. Вторая группа студентов может быть менее мотивирована, менее трудолюбива или может отличаться в каких-то других, ненаблюдаемых отношениях. Если бы Дейл и Крюгер обнаружили, что студенты, поступившие в элитные учебные заведения, впоследствии зарабатывали больше, чем студенты, принятые в одно из элитных учебных заведений, но выбравшие менее престижный вуз, мы все же не могли бы быть уверены, что разница в их будущих доходах объясняется учебой в элитном учебном заведении, а не особенностями человека, получившего шанс поступить в элитное учебное заведение и воспользовавшегося им. Но в исследовании Дейла и Крюгера эта потенциальная ошибка не играет существенной роли. Дейл и Крюгер обнаружили, что студенты, которые поступили в элитные учебные заведения, впоследствии зарабатывали ненамного больше тех, кто выбрал какой-либо другой вариант продолжения учебы, несмотря на то обстоятельство, что студенты, отказавшиеся поступить в элитные учебные заведения, могли обладать другими (помимо образования) особенностями, которые мешали им зарабатывать больше. Как бы то ни было, упомянутая мною ошибка заставляет авторов данного исследования скорее преувеличивать денежные выгоды учебы в элитных колледжах и университетах, которые в любом случае оказываются несущественными.

78

Я не имел права на получение этой медали за 2010 год, поскольку к тому времени мне уже было больше сорока лет. К тому же я не сделал ничего, что давало бы мне право на получение такой награды.

79

Судебный процесс The United States vs. Jones.

80

См. http://www.stata.com/.

81

См. http://www.sas.com/technologies/analytics/statistics/.

82

См. http://www-01.ibm.com/software/analytics/spss/products/statistics/.

83

Издана на русском языке: Хафф Д. Как лгать при помощи статистики. – М.: Альпина Паблишер, 2015. Прим. ред.

<< | >>
Источник: Чарльз Уилан. Голая статистика. Самая интересная книга о самой скучной науке. 2016

Еще по теме Сноски:

  1. Каталоги и черный PR
  2. Где твоя рациональность, человече?
  3. Другие виды свопов
  4. Экономическая наука и социология
  5. Экспериментальная психология
  6. Влияние ученых-схоластов
  7. Концепция торгового баланса как инструмент анализа
  8. Упорство
  9. Вспомогательная аксиома № 15. Никогда не пытайтесь спасти плохие инвестиции за счет усреднения
  10. Спекулятивная стратегия
  11. Основная аксиома № 12