Читать книгу - "Цифры врут. Как не дать статистике обмануть себя - Том Чиверс"
Аннотация к книге "Цифры врут. Как не дать статистике обмануть себя - Том Чиверс", которую можно читать онлайн бесплатно без регистрации
Чтение на ночь сокращает жизнь. Видеоигры провоцируют массовые убийства. Газировка делает людей агрессивными. Что?! Нет!Каждый день медиа пишут о сенсационных открытиях и шокирующих результатах исследований. Но не всем им можно верить: статистические погрешности, намеренные фальсификации и неочевидные огрехи никто не отменял.Из-за пандемии COVID-19 человечество было вынуждено пройти ускоренный курс статистики: теперь мы неплохо разбираемся в графиках, кое-что слышали о нормальном распределении и знакомы с ошибкой выжившего. Но нам еще многое предстоит узнать: как работают математические модели? Чем отличаются абсолютные и относительные риски? О чем говорят рейтинги? Что такое ошибка техасского стрелка? Научный журналист Том Чиверс и преподаватель экономики в Даремском университете Дэвид Чиверс на примерах громких заголовков ковидного времени показывают, как не дать себя обмануть с помощью чисел.В формате PDF A4 сохранен издательский макет книги.

А теперь представим, что вам не терпится вернуться домой, ведь ребенку пора полдничать. Вы хотите убедить его, что на самом деле идет отлив и нет смысла ждать разрушения замка, так что всем нужно забраться в машину. Как это сделать?
Довольно просто: надо правильно выбрать стартовую точку. Вы говорите ребенку: «Смотри – в 15:50 волна зашла на берег на 26 метров. Прошло 50 минут, но больше она так далеко не заходила. С 15:50 вода не поднималась».
В общем, это верно: волны действительно с тех пор так далеко не заходили, но в целом это надувательство. Если выбрать для начала отсчета любую другую точку, виден стойкий подъем. Эта единичная резвая волна – то ли моторка пронеслась, то ли кит ударил хвостом – выбивается из ряда других, но не меняет общей тенденции роста.
Было бы странно провернуть что-то подобное со своим ребенком, но вообще такой подход к данным встречается повсеместно. В 2019 году The Sunday Times на первой полосе объявила, что «доля самоубийств среди подростков за последние восемь лет почти удвоилась». Это была манипуляция, аналогичная той, что проделал наш воображаемый отец со своим ребенком, только наоборот. За начало отсчета был взят 2010 год, когда уровень подростковых самоубийств в Англии и Уэльсе оказался рекордно низким. Сравнение с любым годом после 2010-го показало бы подъем (а можно было взять любой предшествующий год и показать спад).
Подбор подходящих начальной и конечной точек – пример построения гипотез, когда результаты уже известны (для обозначения этого даже есть специальное слово HARKing – hypothesising after results are known). Это значит, что сначала вы собираете данные, а потом изучаете их в поисках чего-нибудь удивительного. В зашумленных наборах данных – например, об изменении климата или доле самоубийств – есть естественные вариации: что-то увеличивается или уменьшается без определенных причин, как волны. При желании можно подобрать необычно высокую или низкую начальную или конечную точку так, чтобы подтвердить тенденцию роста или спада. Для того чтобы обнаружить долгосрочную тенденцию (вроде прилива), недостаточно рассмотреть самое большое или самое маленькое значение.
Есть и другие способы подобных манипуляций. Можно выбрать для изучения только часть своих данных или задать определенные критерии отбора. Например, в статье о самоубийствах говорилось о подростках – причем именно 15–19-летних. Ни в одной другой возрастной группе подъема не было обнаружено; а поскольку – к счастью – подростки очень редко совершают суицид, небольшие случайные изменения данных могут приводить к сильным перепадам в процентном отношении. Если бы рассматривался более широкий возрастной диапазон – от 10 до 29 лет, – такого скачка не было бы.
Похожая ситуация и с климатом. Температура воздуха на поверхности Земли долгое время не достигала уровней 1998 года, но в верхних трех метрах океанской воды заключено столько же тепловой энергии, сколько во всей атмосфере.
И проблема выходит за рамки климатологии или сводок о самоубийствах. HARKing, как и погоня за новизной, – это серьезная проблема в науке. В Центре доказательной медицины при Оксфордском университете обнаружили, что даже в статьях, опубликованных в самых уважаемых медицинских журналах, нередко уже после того, как испытание зарегистрировано, без упоминания в отчете меняется цель исследования. Это позволяет авторам изменять начальную и конечную точки и даже полностью переписывать критерии успеха. Сменить цель можно по вполне уважительной причине, но можно и ради p-подгонки – ее мы обсуждали в главе 5 (и это все равно нужно указывать в статье).
Справиться с этим затруднением часто бывает непросто. Вы ведь должны указать начало вашего набора данных, и обычно оно выбирается наугад. Если числа колеблются в большом диапазоне, то все может сильно измениться от того, выбрали вы в качестве точки отсчета маленькое значение или большое. Если вы член правительства и хотите показать, что благодаря вашим действиям стало меньше нищих детей, то можете выбрать такой год, когда бедность была особенно высокой, и сказать: «Смотрите, как она упала!»; а если вы находитесь в оппозиции, то можете выбрать год, когда бедность была на особенно низком уровне, и возразить: «Смотрите, как она выросла!»
Иногда полезно рассмотреть более общую картину или проверить, идет речь о реальной тенденции или это просто случайный зигзаг. Если же вы специально перебираете данные, чтобы найти эффектные начало и конец для своего фрагмента, то почти наверняка занимаетесь фальсификацией.
Между прочим, газеты в основном перестали писать о том, что глобальное потепление прекратилось в 1998-м, потому что 2014, 2015 и 2016 годы оказались жарче него – притом каждый был жарче предыдущего; жуткая рекордно жаркая троица. Можно сколько угодно выбирать пиковые значения и на их основе рассказывать сомнительные истории, но рано или поздно прилив все равно наступит.
Глава 17
Прогнозирование
Каждые несколько месяцев британское Управление бюджетной ответственности (OBR) делает прогнозы экономического развития страны, и их – вполне естественно – публикует пресса. Например, в марте 2019-го The Guardian написала (в полном соответствии с истиной), что OBR предсказывает годовой прирост экономики в размере 1,2 %. Довольно пессимистичная оценка, но, как утверждалось в статье, дальше должно быть получше.
Конечно, дальше лучше не стало: почти через год в Великобритании объявили локдаун, чтобы одолеть COVID-19, и экономика меньше чем за два месяца сократилась на 25 %. Было бы, наверное, несправедливо ожидать, что OBR или The Guardian предвидят пандемию. Но все подобные прогнозы – 1,2 %-ный рост в этом финансовом году, снижение безработицы на 2 % в этом квартале, повышение температуры на этой планете на 2,6 °C к 2100-му – вызывают вопрос: как они составляются? Можно ли им верить?
Давайте на время забудем об экономике и подумаем о погоде в северном Лондоне. В тот день, когда мы это пишем, погодное приложение BBC для района Харинги показывает значок тучи, из которой польется дождь в 14:00. Увидев это, вы можете подумать, что в 14:00 пойдет дождь.
Однако это несколько опрометчиво. Под значком написано 23 %. Приложение полагает, что в 14:00 дождь необязателен, – оно считает, что вероятность осадков в это время менее одной четвертой, хотя и разместило иконку тучи. (Если вас интересует погода в случайный день за несколько месяцев до того, как вы это прочтете, в месте, где вы, возможно, не живете, то знайте: относительно дождя в более позднее время уверенности у него было уже побольше. К 19:00 вероятность повысилась до 51 %. Но в 14:00 небо было безмятежно-голубым.)
Прогноз погоды – это не мистическое окно в будущее, не предсказания
Прочитали книгу? Предлагаем вам поделится своим впечатлением! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.
Оставить комментарий
-
Гость Алла10 август 14:46 Мне очень понравилась эта книга, когда я её читала в первый раз. А во второй понравилась еще больше. Чувствую,что буду читать и перечитывать периодически.Спасибо автору Выбор без права выбора - Ольга Смирнова
-
Гость Елена12 июнь 19:12 Потрясающий роман , очень интересно. Обожаю Анну Джейн спасибо 💗 Поклонник - Анна Джейн
-
Гость24 май 20:12 Супер! Читайте, не пожалеете Правила нежных предательств - Инга Максимовская
-
Гость Наталья21 май 03:36 Талантливо и интересно написано. И сюжет не банальный, и слог отличный. А самое главное -любовная линия без слащавости и тошнотного романтизма. Вторая попытка леди Тейл 2 - Мстислава Черная