4 июля 2024

“Искусство всякого пропагандиста и всякого агитатора в том и состоит, чтобы наилучшим образом повлиять на данную аудиторию, делая для нее известную истину возможно более убедительной, возможно легче усвояемой, возможно нагляднее и тверже запечатлеваемой.”.
— Ленин
— Ленин
Когда я начал писать этот блог в конце 2020 года, одна из моих первых идей для поста называлась “Как не быть обманутым вирусными графиками”. У меня был готов список известных графиков. Но по какой-то причине я отложил этот пост, и с годами список графиков становился все длиннее, и я продолжал откладывать его.
Ну, теперь всё. Наконец-то меня так разозлил вирусный график, что я больше не могу откладывать этот пост. Но список стал настолько длинным, что мне придется разделить пост на две части. Итак, сегодня мы узнаем, как идентифицировать графики, содержащие дезинформацию — намеренный обман, неосторожные ошибки или просто в целом бессмысленные данные. В части 2 мы узнаем, как интерпретировать диаграммы, которые используют хорошие данные, но которые рассказывают историю с большим количеством нюансов, чем понимает большинство людей.
Очень плохой график соотношения арендной платы и дохода
Активист и крикун в социальных сетях Джошуа Поташ недавно опубликовал видео, в котором утверждается, что арендная плата растет намного быстрее, чем доходы домохозяйств с 1985 года:

Это враньё. Хотя внизу экрана написано “Примечание: Арендная плата и доход скорректированы с учетом инфляции”, это либо ошибка, либо ложь. Только доход корректируется с учетом инфляции. Красная линия арендной платы - нет. С тех пор была добавлена заметка сообщества, указывающая на ошибку, но не раньше, чем твит Поташа смог набрать невероятные 77 000 лайков и 17 000 репостов.
Сравнение скорректированного на инфляцию (или “реального”) экономического показателя с нескорректированным (“номинальным”) - один из самых простых способов составить график, который привлекает внимание и вызывает клики, но который является пустышкой. Если вы сравниваете скорректированный на инфляцию показатель с некорректированным, со временем между ними возникнет большой разрыв. Вместо этого, чтобы провести сравнение яблок с яблоками, вы всегда должны сравнивать либо два скорректированных числа, либо два нескорректированных числа.
Давайте перейдем на FRED, странице с данными, которую ведет Федеральная резервная система, и посмотрим, каковы истинные цифры. Давайте сравним средний доход домохозяйства с показателем индекса потребительских цен для “арендной платы за основное жилье”, который является стандартным показателем для средней арендной платы по стране. И давайте установим их оба равными 100 в 1985 году (именно с этого начинается график Поташа), чтобы мы могли посмотреть на процентное увеличение. Вот что мы получаем:

Здесь вообще нет большого расхождения; эти два числа очень точно отслеживают друг друга. Примерно в 2007 году наблюдается небольшое расхождение, и доход немного отстает от арендной платы, но к 2021 году они все еще довольно близки, на чем данные заканчиваются.
Но, по крайней мере, арендная плата выросла немного больше, чем доход, верно? Ну... Нет. На самом деле доход домохозяйства зависит от количества людей в домохозяйстве. Если мы посмотрим на средний личный доход, то обнаружим, что с 1985 года он фактически вырос больше, чем арендная плата.

В любом случае, это не первый случай, когда эта ошибка становится вирусной. Еще в 2019 году в статье Wall Street Journal приводились некоторые данные из книги профессора права Джорджтаунского университета Адама Левитина, которые оказались просто старой ошибкой “номинальное против реального”.:

Аналогично диаграмме Поташа, и доход, и цены на жилье помечены как “реальные”, в то время как на самом деле “реальным” является только показатель дохода, а показатель цены на жилье на самом деле номинальный. WSJ составила свою собственную таблицу данных и опубликовала ее в Твиттере, и, как и у Поташа, они стали вирусными. Однако у них хватило порядочности удалить свои твиты после того, как им указали на ошибку — хотя и не раньше, чем многие влиятельные фигуры были случайно дезинформированы.
Так или иначе, арендная плата и доход в Америке в основном идут в ногу друг с другом (хотя это не значит, что вы всегда можете позволить себе жить в том месте, где вам хотелось бы жить). Это полезно знать, но это не дает ответа на более глубокий вопрос: как мы можем избежать подобных графиков? В приложении, ранее известном как Twitter, теперь есть функция “заметки сообщества”, которая в конечном итоге улавливает большинство ошибок и недостоверной информации в вирусных твитах, но у TikTok нет такой функции, и нет простого способа определить графики, вводящие в заблуждение. Вы, по сути, предоставлены сами себе, и только ваш ум может защитить вас, в мире людей, которые хотят заполучить ваши клики и взгляды.
Ваш ум, а также ваш дружелюбный блогер по экономике Noah Smith. Итак, вот несколько приемов, которые помогут вам обнаружить неверные данные.
Относитесь скептически к впечатляющим графикам; проверьте, не были ли они опровергнуты
В общем, первое правило вирусных графиков заключается в том, что чем более сногсшибательными и поразительными они являются, тем больше вероятность того, что происходит что-то подозрительное. Как говорится, “экстраординарные заявления требуют экстраординарных доказательств”. График соотношения дохода от продажи калия и арендной платы от Поташа - очень хороший пример. В среднем по Америке арендаторы тратят на аренду около 30% своего дохода, так что, если бы арендная плата действительно удвоилась по отношению к доходу с 1985 года, американцы сейчас тратили бы на аренду 60% своего дохода. Похоже ли это на то, что происходит на самом деле? Нет. Таким образом, его график должен был сразу вызвать подозрения, основываясь на размере заявленных цифр.
Это не означает, что каждый сногсшибательный график, который вы видите, является обманом. Например, вот график ВВП с 1000 года, который, вероятно, в принципе верен:

ВВП на душу населения в Японии и Великобритании с 1000 по 2018 годы
Теперь существует множество потенциальных проблем с этими данными (которые получены в рамках проекта Maddison в Университете Гронингена). На самом деле мы не знаем исторического населения этих регионов, потому что они не вели тщательных записей; мы просто строим предположения, основываясь на том, сколько людей, по нашему мнению, могла бы прокормить доступная земля. Мы также не знаем фактической величины экономического производства за этот период; мы просто строим предположения, основываясь на том, какой, по нашему мнению, была структура промышленности в тот исторический период и насколько, по нашему мнению, продуктивной была каждая отрасль. Это очень приблизительное предположение. Но даже если цифры на этом графике отличаются в 2 раза, это будет выглядеть в основном так же — экспонента, показывающая, что человечество стало намного богаче, когда произошла промышленная революция.
Но в целом, такие драматичные графики, скорее всего, будут каким-то образом приукрашены или смягчены. Нечто столь драматичное, как Промышленная революция, встречается очень редко! Большинство событий в мире вполне нормальны. Таким образом, чем более сногсшибателен график, тем больше вы должны быть склонны ознакомиться с ним, прежде чем верить в историю, которую он рассказывает.
Самое простое, что вы можете сделать, чтобы проверить вирусный график, - это посмотреть, не критиковал ли его кто-то другой. Приложение, ранее известное как Twitter, на самом деле сейчас действительно хорошо справляется с этим, поскольку в нем есть функция под названием “Заметки сообщества”, в которой под публикацией появляются краудсорсинговые исправления. Комментарии сообщества не всегда верны, но обычно так оно и есть. Politifact и другие сайты, занимающиеся проверкой фактов, также хороши в этом, хотя они тоже не всегда все делают правильно. В качестве третьего варианта вы можете проверить Reddit, чтобы узнать, не опроверг ли кто-нибудь уже этот график; Обратный поиск изображений в Google очень полезен для этого.
Иногда вы действительно можете использовать старый вирусный график в качестве проверки работоспособности нового вирусного графика. Например, возможно, вы уже видели этот график раньше, поскольку он был очень вирусным:

Изменение цен: январь 2000 - июнь 2022
AEI
Теперь у меня есть некоторые незначительные проблемы с тем, как обычно интерпретируется этот график (о которых мы поговорим во 2 части 2). Но данные хорошие. И если вы видели это раньше, то, возможно, помните, что “средняя почасовая заработная плата” поднимается выше, чем “жилье”. Средняя почасовая заработная плата - это не совсем то же самое, что средний доход, но это хороший приблизительный показатель. И цены на жилье - это нечто большее, чем просто арендная плата, но опять же это хороший приблизительный показатель. Итак, если вы знакомы с этим графиком, вы должны сразу же с подозрением отнестись к любому графику, который показывает, что арендная плата или цены на жилье растут намного, намного быстрее, чем доход.
Еще одна хорошая проверка на здравомыслие - это продумать последствия графика. С помощью графика соотношения жилья и дохода, быстрая мысленная математика показала, что он утверждает, что арендная плата удвоилась в процентном отношении к доходу. Многие графики имеют довольно очевидные следствия, и это помогает их осмыслить. Даже если окажется, что график не является бредом, размышления над радикальными последствиями помогут понять, почему этот график важен.
Последняя быстрая проверка заключается в просмотре источника данных. Если у диаграммы нет источника данных, это красный флаг. Если же источник указан, то иногда можно получить некоторую информацию о том, насколько надежными могут быть данные. Правительственные источники данных, как правило, очень хороши — в правительственных данных, безусловно, есть допущения и двусмысленности, но, как правило, в правительстве работает много умных людей, которые делают все, что в их силах. Есть также некоторые известные плохие источники, такие как Shadowstats, чьи данные полностью сфабрикованы и которые были опровергнуты много-много раз. Многие данные не подпадают ни под одну из этих категорий, но
“Стандартный контрольный список” критических замечаний не очень полезен
Одна вещь, которую я нахожу не очень полезной, - это иметь стандартный список вещей, к которым нужно немедленно относиться критически. Неспособность сделать поправку на инфляцию действительно является очень распространенным источником вводящих в заблуждение графиков, поэтому всегда полезно проверять. Но поскольку это уже широко известно, многие люди кричат: “А что, если сделать поправку на инфляцию?” на графиках, скорректированных с учетом инфляции. И вы получаете неаккуратных или недобросовестных людей, наклеивающих ярлык “с поправкой на инфляцию” на данные, которые не скорректированы с учетом инфляции, как в случае с графиками жилья и доходов выше.
Два других эмпирических правила, которые часто подводят людей, - это 1) медиана против среднего и 2) на душу населения. Многие люди знают, что средние значения подвержены отклонениям, например, когда Илон Маск заходит в бар, и сразу же среднее благосостояние бара увеличивается в 100 раз. Поэтому многие люди, обеспокоенные неравенством, стали требовать, чтобы все использовали медианы вместо средних значений для всего. Но средние показатели часто являются совершенно точными показателями — если вы смотрите на среднее потребление калорий или среднее время, проведенное за видеоиграми, на самом деле нет необходимости использовать медиану. В сутках всего 24 часа, поэтому не существует "Илона Маска среди людей, которые играют в видеоигры" (нет, даже не тот ваш друг). Между тем медианы, как правило, трудно и медленно поддаются измерению, поэтому они часто недоступны.
Что касается “на душу населения”, да, есть графики, которые следует скорректировать с учетом численности населения, но не являются таковыми. Это особенно характерно для карт; карта США, на которой показано общее потребление молока или общее количество владельцев собак и т.д. это будет просто карта больших городов Америки. Чтобы сделать эту карту полезной, вам следует обратить внимание на потребление молока или владение собаками на душу населения. Но есть некоторые графики, где показатель на душу населения на самом деле не имеет значения. Например, многие люди, взглянув на график суммарных выбросов углекислого газа по странам, сразу же воскликнут: “А как же показатель на душу населения?!”. Но климату безразличны выбросы на душу населения, только общие; в Кувейте выбросы на душу населения более чем в три раза выше, чем в Китае, но политика Кувейта практически не имеет значения для будущего планеты, в то время как политика Китая имеет огромное значение.
Наконец, я считаю, что плохой способ проверить график - это просмотреть ответы или комментарии в блоге. Всегда найдется кто-то, кто поспешит назвать график ложным, но эти быстрые отклики не являются надлежащим краудсорсингом - они не проверяются, как заметки сообщества, и не поддерживаются голосованием, как сообщения на Reddit, а люди, делающие их, часто неинформированы и/или предвзяты.
Например, если вы опубликуете график выбросов углекислого газа по странам, кто-нибудь всегда поспешит заявить, что выбросы в Китае намного больше, чем в Америке, потому что США передали свои загрязняющие отрасли в Китай. Это просто миф; США потребляют примерно столько же выбросов, сколько производят, как и Китай, и небольшие разрывы между выбросами, основанными на потреблении и производстве, со временем не изменились. Но люди продолжают выступать с этой фальшивой критикой. Так что остерегайтесь фальшивых разоблачений.
В любом случае, несмотря на все сказанное, есть несколько хороших эмпирических правил, которые вы можете использовать, чтобы избежать обмана с помощью вирусных графиков. Но это не перечень стандартных критических замечаний, которые можно просто выпалить, не задумываясь; это эмпирические правила о том, как самостоятельно оценивать графики, которые вы видите.
Поймите, на что вы смотрите
Первое, что вы должны знать о любом графике, - это то, что он измеряет. Если ось не помечена, это большой красный флаг. На самом деле, некоторые графики на самом деле вовсе не графики, а просто визуальные изображения расплывчатых идей, составленные так, чтобы они выглядели как графики.
Далее, убедитесь, что вы действительно понимаете обозначение оси — если это какая-то расплывчатая вещь вроде “Национального индекса крутости” или какое-то неразборчивое название переменной, убедитесь, что вы знаете, что это означает, прежде чем делать выводы.
Например, вот очень известный график от Oxfam, который якобы показывает, что богатые люди ответственны за большую часть выбросов в мире:

Доля выбросов СО2 по мировой популяции. Беднейшие 50% ответственны за 10% общих выбросов. Oxfam
Этот график регулярно становится вирусным, поэтому важно понимать, почему он в принципе бессмысленен. С графиком много проблем, но самая большая проблема заключается в том, что, несмотря на название, на самом деле он вообще не показывает выбросы CO2. Вместо этого то, что он показывает, - это "выбросы в результате образа жизни", которые придумал Oxfam. Видите, что график представляет собой идеально гладкую кривую вместо неровной полосы или линии с зазубринами? Это всегда очень сильный намек на то, что то, на что вы смотрите, - это не фактические данные, а выходные данные модели.
Насколько я могу собрать воедино, вот что сделали Oxfam. Сначала они сделали целую кучу неверных предположений о том, откуда берутся выбросы углекислого газа, например, предположили, что доход равен потреблению (неверно!), что бедные люди потребляют те же продукты, что и богатые (неверно!), что количество выбросов на доллар потребления подчиняется какой-то определенной функции, которую они придумали, и так далее. Затем они полностью проигнорировали государственные расходы, полностью проигнорировали землепользование, ввели в модель старые данные о доходах за 2007 год, чтобы проигнорировать рост развивающихся стран с тех пор, и получили бессмысленный, бесполезный, но безумно вирусный график, который вы видите здесь.
Можно было бы покопаться в методологии, найти все эти неверные предположения и отправиться на поиски тех, кто уже опроверг график. Но если вы просто взглянете на ось и скажете: “Подождите... Я не знаю, что, черт возьми, означает "выбросы в результате образа жизни", это звучит как нестандартный показатель, и это не то же самое, что общая метка на графике, поэтому я дважды подумаю, прежде чем нажимать кнопку ретвита на этом графике", то у вас все будет в порядке. Мораль этой истории: посмотрите, что измеряет график, и посмотрите, имеет ли это смысл для вас.
В качестве отступления, еще одной основной проверкой здравомыслия на графике Oxfam является тот факт, что левые, как правило, выступают против налогов на выбросы углерода на том основании, что эти налоги ударили бы по бедным американцам сильнее, чем по богатым американцам. Если бы богатые люди действительно потребляли намного больше углерода, чем бедные, налоги на выбросы углерода были бы прогрессивными, по крайней мере, в США.
Большинство примеров сбивающих с толку ярлыков не столь вопиющи, как этот, но все равно могут вызвать широко распространенное непонимание. Например, США по неясным политическим причинам разделяют свои федеральные расходы на “обязательные” и “дискреционные”, а оборону относят к “дискреционным”. Таким образом, люди будут делиться графиками только дискреционных расходов и использовать их, чтобы утверждать, что оборона составляет основную часть от общей суммы, в то время как на самом деле это всего лишь около 12%.
Иногда проблемы с тем, что измеряет график, могут быть более тонкими, чем просто осознание того, что вы не знаете, что означает метка. Например, может быть легко перепутать процентное увеличение с увеличением на процентный пункт. Если безработица составляет 5%, а затем она повышается до 6%, то это означает увеличение безработицы на 20%, но всего на 1 процентный пункт. Поэтому полезно понимать, что означают эти величины.
Проверьте оси, проверьте точки данных
В любом случае, даже если данные графика четко определены, существует множество вводящих в заблуждение способов их представления. Хороший способ избежать введения в заблуждение — всегда проверять оси, особенно ось y, которая обычно является ключевым параметром, который на самом деле измеряется графиком, и которой, как правило, часто манипулируют.
Единственное, на что следует обратить внимание, - это на ужасную двухосевую диаграмму. Иногда это неизбежно — если вы пытаетесь сравнить два показателя, которые находятся в разных единицах измерения на одном графике, у вас действительно нет особого выбора. Но это почти всегда затрудняет чтение диаграммы, потому что заставляет вас вычислять две оси y, и потому что вторую ось легко пропустить, потому что она находится справа. Этим также довольно легко злоупотреблять, потому что вы можете растягивать и сжимать свою ось до тех пор, пока не создадите впечатление, что объекты выстраиваются в линию больше, чем это есть на самом деле. Например, Ларри Саммерсу по праву пришлось немало потрудиться, чтобы составить двухосевую диаграмму, которая сопоставила инфляцию 1970-х годов с инфляцией 2020-х годов, хотя инфляция 70-х годов была намного выше:

Этот график должен отрезвить каждого, кто уверен, что мы вернули ценовую стабильность
Позже Саммерс написал статью для Washington Post с графиком, на котором две инфляции были нанесены на одну и ту же ось y. В нем содержалась аналогичная мысль, но гораздо менее поразительная. 1960-е годы на самом деле не совпадают с 2010-ми годами с точки зрения инфляции, а пик 2020-х годов намного ниже:

Двухосевой график также позволяет сдвинуть две линии ближе друг к другу, как это сделали Financial Times здесь:

Доллар доминирует в валютных резервов, но его лидирующее положение сменяется
FT via Marilyn Maupin
Это создает впечатление, что юань вот-вот догонит доллар в доле мировых резервов, хотя на самом деле она составляет 60% и 3%. Позже линии были разделены на две панели, когда группу людей разозлили двойные оси на исходном графике, но это ненамного лучше, чем раньше. Примеры такого рода зрительной иллюзии, к сожалению, довольно распространены.
Еще одна вещь, на которую вам следует обратить внимание, - это то, где начинается ось y. Вопреки тому, что говорят некоторые люди, это нормально - иметь диаграммы, где ось y не начинается с нуля. Например, если вы строите график температуры тела человека, нет необходимости начинать с нуля, потому что кто-то был бы мертв, если бы температура его тела поднялась до 85 градусов. Колебания всего на один-два градуса сильно влияют на температуру человеческого тела, поэтому вы хотите иметь возможность увеличить изображение и увидеть эти колебания.
Тем не менее, вам следует обратить внимание на то, где начинается ось y. Не думайте, что все начинается с нуля! Например, комбинируя двойную ось с одной усеченной осью y, Тайлер Виген придумал свою знаменитую шутку об утоплениях в бассейне, коррелирующих с выходом фильмов Николаса Кейджа:

(Опять же, мы говорим о Николасе Кейдже, так что никогда не знаешь наверняка...)
Кроме того, убедитесь, что вы понимаете, что происходит с единицами измерения по оси y (и оси x). Вот график из Fox News, который появился в апреле 2020 года:

Как вы можете видеть, интервалы на оси y имеют произвольный размер, что делает этот график практически нечитаемым. Иногда графики делают это и ставят небольшую закорючку на оси y, чтобы вы знали, что они это сделали, но это все равно трудно увидеть, если не обратить пристального внимания.
Некоторые графики также имеют нелинейный масштаб. Часто это нормально, но когда вы накладываете два элемента друг на друга на графике, где масштаб не линейный, результаты могут быть забавными. Поэтому обратите пристальное внимание на масштаб оси y.
И есть этот знаменитый пример, когда создатели графика просто... перевернули его с ног на голову…

Количество убийств с применением оружия во Флориде
2005 - Флорида принимает закон "Стойте на своем"
Reuters via Livescience
Сейчас я в основном сосредоточился на оси y, но иногда оси x также могут быть обманчивыми. Всегда стоит взглянуть, не пытается ли кто-нибудь аргументировать 2023 год графиком, который заканчивается в 2009 году.
Наконец, в дополнение к осям, еще одна вещь, на которую следует обратить внимание, - это отсутствие на диаграмме каких-либо данных. Например, иногда люди создают графики с разными конечными точками, и это может быть трудно заметить. Я собираюсь придираться к моему другу Джону Берн-Мердоку из Financial Times, который обычно является одним из самых выдающихся создателей вирусных графиков в экономической блогосфере и чьи графики я часто перепечатываю. На мой взгляд, в этом он слегка облажался:

В Норвегии люди с разным распределением доходов имеют высокий уровень жизни.
В Великобритании и США богатые живут даже лучше, но беднейшие занимают низкое место по сравнению с другими странами
Обратите внимание, что серия данных о доходах в США заканчивается на год раньше, чем в других странах; в ней не указан 2020 год, год, когда многие страны раздавали огромные суммы денег своим гражданам во время пандемии. США дали больше, чем почти кто-либо другой, и располагаемый доход подскочил на значительную величину. Но на этой диаграмме показан только 2020 год для европейских стран, поскольку данные по США за 2020 год еще не были доступны. Поэтому, если вы не очень внимательно посмотрите на этот график, то в итоге получится, что средний доход в США к 2020 году отставал от таких стран, как Норвегия, хотя на самом деле это было не так.
Теперь поймите, что график Берна-Мердока, в отличие от графика соотношения доходов и жилья в начале этого поста, не является дезинформацией. И это не бессмысленные выдуманные данные, подобные графику Oxfam. Оси также не вводят в заблуждение. Насколько я могу судить, в программе записи данных, которую использует Мердок, нет ошибок или двусмысленностей; отсутствует только одна ключевая точка данных, которая меняет визуальную историю, представленную на графике. (Я также хотел бы, чтобы диаграмма включала больше процентилей из середины распределения, вместо 5-го и 95-го процентилей, по которым данные по США даже не были доступны.)
В любом случае, мораль этой истории заключается в том, что часто бывает полезно проверить мелкие детали.
Собирая все это воедино
В июле 2018 года энергичный молодой автор Bloomberg по имени Noah Smith опубликовал следующую диаграмму в колонке о налоговой реформе Трампа, показывающую падение реальной заработной платы почти на 2% во втором квартале 2018 года:

Изменение реальной зарплаты с 2006
Да, этот график — чушь собачья - пожалуй, худший график, который я когда-либо публиковал. И это стало вирусным, им поделились видные политики-демократы, такие как Нэнси Пелоси, прежде чем его раскритиковали. Да, друзья мои, я был переносчиком вирусной дезинформации. (Я написал последующий пост, в котором извинялся за плохой график и объяснял, почему я включил его - правительственные данные за второй квартал еще не были опубликованы, а куча людей в Твиттере публиковали цифры по зарплате, поэтому я просто последовал за толпой и включил эти данные в свою колонку, не занимаясь независимым осмыслением. Плохо!)
Итак, давайте посмотрим, как мы могли бы использовать методы, описанные в этом посте, чтобы увидеть, что моя диаграмма выше была чушью.
Сначала давайте проведем несколько проверок на вменяемость. Утверждается, что мой график показывает снижение реальной заработной платы на 1,8% от квартала к кварталу. Это примерно на 7% меньше в годовом исчислении, что, если вы посмотрите на правительственные данные, практически неслыханно:

Итак, сразу скажу, что это число слишком много, чтобы быть реальным.
Далее, давайте посмотрим на то, что, как утверждается, измеряет график. Ось y - это не уровень реальной заработной платы, а процентное изменение реальной заработной платы с 2006 года. Это сбивает с толку, потому что это означает, что когда мы смотрим на падение на четверть, мы смотрим на изменение в процентах по сравнению с годом, которого даже нет на самом графике. Вам нужно некоторое время посмотреть на график, чтобы понять, что значительное падение в конце примерно соответствует падению реальной заработной платы на 1,8% по сравнению с предыдущим кварталом. Сложность выяснения того, что вообще означает этот график, должна быть еще одним тревожным сигналом.
Третий красный флажок заключается в том, что числа на оси y отрицательные. Это означает, что данные PayScale о заработной плате показали, что реальная заработная плата в 2018 году была ниже, чем в 2006 году! Но любой, кто хотя бы поверхностно знаком с правительственными данными, знал бы, что реальная заработная плата в 2018 году на самом деле была выше по сравнению с 2006 годом (на самом деле примерно на 7%). Так что это еще одна причина, по которой данные о заработной плате PayScale должны были сразу вызвать подозрения.
Оказывается, данные о заработной плате PayScale были просто бредом — они регулярно демонстрировали резкие колебания, не имевшие никакого отношения к фактическим данным, и представляли картину заработной платы в стране, которая была гораздо более негативной, чем реальность. PayScale пытались защитить свои данные, но это было безнадежно. С тех пор они пересмотрели свою методологию, чтобы она была гораздо менее волатильной, но я бы все равно не стал использовать ее — или какие-либо данные о заработной плате с частного веб-сайта.
Но суть здесь в том, что плохие графики на самом деле довольно легко обнаружить, если вы просто обратите внимание и проявите немного независимого мышления — чего я определенно не делал в 2018 году. Мне хотелось бы думать, что с тех пор я усвоил свой урок.
Распознать плохие графики легко; распознать вводящие в заблуждение повествования сложно
В любом случае, это было забавное упражнение по выявлению вопиюще плохих графиков. Такие вещи, как ложные заявления о корректировке инфляции, неправильно помеченные данные, сфабрикованные измерения, дурацкие оси y и сомнительные источники данных, на самом деле довольно легко обнаружить, если уделить минутку и удержаться от первоначального желания нажать кнопку "Поделиться". Не позволять себя одурачить - хороший способ ощутить теплое чувство гордости.
Но на самом деле диаграммы, которые являются абсолютным бредом, гораздо менее опасны, чем диаграммы, данные которых в основном верны, но которые привязаны к вводящим в заблуждение повествованиям. Откровенно неверные графики быстро развенчиваются, будь то в заметках сообщества, Politifact или Reddit, или просто в блогах, подобных этому. Но вводящие в заблуждение рассказы, которые привязываются ко многим другим вирусным графикам, могут сохраняться годами, внедряясь в умы общественности до тех пор, пока они не станут неотличимы от общепринятой реальности. Обнаружить и отделить друг от друга эти повествования - гораздо более сложная задача, чем отлов простой дезинформации.
В части 2 этого руководства будет рассказано о том, как не поддаться на эти вводящие в заблуждение рассказы, тщательно обдумав истории, которые, по-видимому, рассказывают вирусные графики. И да, мы собираемся сделать это:

Разница между продуктивностью и зарплатой
2 часть

Сейчас сезон выборов, поэтому вирусные графики разлетаются быстро и яростно, поскольку каждая сторона пытается поддержать экономический нарратив, который поможет ее кандидату победить. В эти трудные, беспокойные, неспокойные времена вы, по сути, предоставлены сами себе как разумный потребитель новостей. Вы не можете доверять ни одному источнику - даже мне! - как абсолютно беспристрастному объяснителю экономических тенденций и событий. Лучшее, что вы можете сделать, - это принять столько данных, сколько у вас есть времени, и попытаться понять, что происходит, используя свои собственные способности к логике и разуму.
Но даже если я не могу быть вашим единственным идеальным источником информации, я могу попытаться помочь вам отточить свой скептицизм и распознать, когда нарратив, которым вас кормят, не выдерживает критики. В сентябре прошлого года я написал статью о том, как распознать вводящие в заблуждение вирусные диаграммы
В приведенных мною примерах - среди которых был и график, который я публиковал еще во времена своей работы в Bloomberg! - данные на графике были либо неверными, либо представлены в искаженном виде. Но есть и множество графиков, в которых базовые данные (вероятно) достоверны, а их представление не является явно плохим, но рассказ, который люди прикрепляют к графику, не совпадает с тем, что на самом деле рассказывают данные.
Этому посвящена вторая часть моего руководства "Как не быть одураченным вирусными графиками". Я собираюсь проиллюстрировать то, что я имею в виду, рассмотрев четыре графика, которые были очень популярны и влиятельны в экономических дебатах конца 2010-х годов:
"График века" Американского института предпринимательства
График "продуктивность труда против зарплаты" Института экономической политики
"График слона" Лакнера и Милановича
График "политического компаса" Ли Друтмана.
Но сначала - небольшой пример того, о чем я говорю. На днях Тейлор Николь Роджерс и Ева Сяо написали статью в Financial Times о том, как иммигранты помогают поддерживать рабочую силу в США в связи с выходом на пенсию представителей бэби-бум поколения. Они проиллюстрировали это графиком:

Сокращение популяции родившихся в США в рабочей силе
У этого графика есть несколько серьезных проблем - он использует двойную ось y и усеченную ось y, из-за чего недавние изменения кажутся гораздо более значительными, чем они есть на самом деле, а также позволяет легко ошибиться и подумать, что иммигрантов сегодня больше, чем коренных американцев в рабочей силе США. Ось x также не включает годы, что, конечно, должно быть. Именно об этих проблемах я говорил в первой части. Но помимо этих проблем, многие правые неверно истолковали историю, которую рассказывал этот график. Вместо истории о выходе на пенсию представителей бэби-бума они интерпретировали ее как историю об иммигрантах, отнимающих рабочие места у коренных американцев:

"Американцев буквально вытесняют с рынка труда"
На самом деле уровень занятости коренных американцев первого возраста выше, чем когда-либо в этом веке - даже выше, чем в годы правления Трампа. На самом деле общее число пожилых коренных американцев в экономике США сокращается по мере того, как "бэби-бумеры" и пожилые представители поколения X рано выходят на пенсию:

Ежегодная статистика труда: Общая численность населения в трудоспособном возрасте: От 55 до 64 лет в США
Другими словами, график о выходе на пенсию представителей бэби-бума был неверно истолкован - в данном случае намеренно и по политическим причинам - как график о том, что рабочие места занимают иммигранты. Данные были неплохими, но изложение было неверным.
В любом случае, давайте перейдем к четырем знаменитым примерам 2010-х годов.
Пример 1: "график века"
В период с 1992 по 2020 год инфляция в Америке была в целом низкой и стабильной. Но этот низкий общий уровень инфляции скрывал значительные изменения в ценах на отдельные товары и услуги - некоторые вещи стали намного дороже, а другие - намного дешевле. На графике, который часто называют "графиком века", Марк Перри и другие сотрудники Американского института предпринимательства проиллюстрировали некоторые из этих разнонаправленных изменений цен. Здравоохранение, образование и уход за детьми стали намного дороже, в то время как автомобили, одежда, мебель, электроника, сотовая связь и программное обеспечение подешевели. Жилье и продукты питания оказались где-то посередине. Перри (который сейчас на пенсии) недавно сделал обновленную версию графика, немного сместив начальную и конечную точки, но график выглядит практически так же, поэтому я буду использовать эту новую версию:

Нет никаких проблем с базовыми данными - они получены из Бюро статистики труда. BLS не всегда делает все идеально правильно - никто не делает, - но они делают все возможное, и у них много умных людей, которые неустанно работают над тем, чтобы сделать эти данные как можно более точными.
У меня есть две небольшие проблемы с тем, как эти данные представлены на диаграмме. Во-первых, цифра платы за обучение в колледже - это общая цифра, которая не включает финансовую помощь. Цена, которую студенты на самом деле платят за колледж, росла гораздо медленнее, чем официально считается, а после 2006 года вообще не увеличивалась. Во-вторых, выбор Перри выделить жилье и еду красным цветом, потому что они подорожали немного быстрее, чем общий уровень инфляции, немного сомнителен - оба показателя растут медленнее, чем зарплата, поэтому они стали более доступными за этот период времени, а не менее.
Но это незначительные проблемы. В целом это хороший график с хорошими данными, и он иллюстрирует очевидный и важный факт об экономике США в последние десятилетия: Физические товары в целом дешевеют, а услуги в целом дорожают.
Однако многие люди, которые видят этот график, считают, что он раскрывает первопричину роста цен на услуги. Они считают, что все дело в государственном вмешательстве и регулировании:

1. "Капитализм делает вещи ДЕШЕВЛЕ, правительство делает вещи ДОРОЖЕ"
2. "Согласно тому, что некоторые люди называют "графиком века", единственными отраслями, где цены выросли выше уровня инфляции, являются также отрасли, в которые правительство сунуло свой нос с помощью регулирования."
И так далее.
В этом нет вины Перри. Он предположил, что это лишь одна из возможных интерпретаций, когда опубликовал исходный график в 2018 году:
Видите какие-нибудь закономерности? Торговые товары (с конкуренцией импорта, например телевизоры) против неторговых товаров (например, уход за детьми), промышленные товары (с конкуренцией импорта, например одежда и автомобили) против услуг (медицина, больницы, образование), конкурентные (программное обеспечение) против защищенных отраслей (здравоохранение), степень государственного участия/финансирования/регулирования?
Но объяснение "степень участия государства" кажется гораздо более популярным, чем объяснения "торговля против не-торговли" и "производство против услуг", несмотря на то, что последние являются вполне правдоподобными объяснениями многих из этих тенденций.
На самом деле, если внимательно посмотреть на этот график, то можно увидеть множество расхождений с объяснением "степень участия государства".
Учебники для колледжей не являются предметом жесткого регулирования, и тем не менее цены на них сильно выросли - по крайней мере, до середины 2010-х годов. Учебники косвенно субсидируются за счет дешевых студенческих кредитов, но их цена фактически перестала расти вскоре после того, как в 2009-2012 годах правительство забрало рынок студенческих кредитов у частного сектора.
Услуги сотовой связи строго регулируются, и все же цены на них снизились. Жилье, между тем, является, вероятно, единственной наиболее регулируемой отраслью в мире, а также субсидируется государством через налоговые льготы и ваучеры, однако его цены за указанный период времени выросли меньше, чем зарплаты.
Что касается платы за обучение в колледже, то в частных школах она гораздо выше, чем в государственных, и их цена в долларовом выражении с 90-х годов выросла гораздо больше.
На самом деле, популярное представление о том, что услуги стоят дорого из-за сочетания регулирования и субсидий, не совсем подходит в качестве комплексного объяснения. Как я уже писал в прошлом году, субсидии - часть истории в некоторых случаях, как и регулирование - часть истории в некоторых случаях, но здесь есть масса нюансов и неоднородностей.
История с "участием государства" также не объясняет, почему многие услуги, которые стали менее доступными с конца 90-х до начала 2010-х годов, стали более доступными за последнее десятилетие:

Зеленым выделен рост почасовой зарплаты
Так что, хотя участие государства почти наверняка играет роль в некоторых различиях цен на "графике века", это, вероятно, лишь один из многих факторов. Воспринимать этот график как доказательство простой версии "либертарианцы правы", как это делают многие люди, - ошибка.
Если здесь и есть какой-то общий урок, то он заключается в том, что когда график показывает множество различных тенденций, следует ожидать, что у этих тенденций может быть несколько различных причин. Редко когда существует "одна экономическая теория, которая управляет всем", и если вы думаете, что график демонстрирует существование такой теории, велика вероятность того, что вы неправильно интерпретировали график.
Пример 2: Продуктивность труда против заработной платы
Пожалуй, ни один график не был столь влиятелен в американском дискурсе за последнее десятилетие, как график "Продуктивность труда против зарплаты". Существует множество версий этого графика, но я буду использовать версии, опубликованные Институтом экономической политики. Вот, пожалуй, самая известная версия графика - версия, которую большинство из нас использовало, когда мы обсуждали этот вопрос в конце 2010-х годов:

Несоответствие между продуктивнстью и оплатой труда типичного работника, 1948-2014 гг.
На самом деле, при составлении этого графика была допущена серьезная ошибка, которую EPI с тех пор исправил! Хотя на графике это не указано, эти два ряда рассчитываются с использованием разных показателей инфляции. Производительность рассчитывается с помощью дефлятора ВВП, а зарплата - с помощью индекса потребительских цен. Первый показатель вырос гораздо меньше, чем второй. Если вы действительно хотите сравнить яблоки с апельсинами, вам нужно использовать одну и ту же меру инфляции. Поэтому в последние годы EPI начал публиковать новые версии графика, где в обеих линиях используется инфляция по ИПЦ:

Это расхождение не столь драматично, но все равно значительно.
Опять же, эти данные получены от BLS, так что это лучшие данные, которые у нас есть. Никаких претензий. И после того, как EPI ввел поправку на инфляцию, в этом графике нет ничего, что могло бы ввести в заблуждение. (Были и более ранние версии графика других аналитических центров, в которых были другие проблемы, но EPI их избежал).
Но как быть с описанием, прилагаемым к этому графику? Здесь все становится сложнее. Многие люди смотрят на этот график и просто думают: "Хм, работники получают недостаточно, они заслуживают того, чтобы им платили больше". И, возможно, это действительно так. Но почему сравнение с продуктивностью труда демонстрирует этот факт?
Причина кроется в экономической теории. Существует очень простая теория заработной платы, которая гласит, что вознаграждение работников должно равняться предельному продукту труда.* Если применить эту простую теорию к графику и предположить, что средняя продуктивность труда близка к предельной производительности**, то график, похоже, говорит о том, что работники не получают того, чего они "стоят". Что, в свою очередь, говорит о том, что корпорации умудряются оставлять себе все большую и большую долю экономического пирога. Элизабет Уоррен, например, использует график EPI, чтобы рассказать именно эту историю:
*На самом деле здесь говорится, что компенсация работникам должна равняться предельному доходу от труда, что несколько отличается от предельного продукта труда. Обычно они не равны.
**Если компании наняли слишком много работников, то предельная производительность будет ниже средней производительности, а значит, экономически эффективным шагом для компаний будет увольнение работников до тех пор, пока производительность не повысится.
За последние несколько десятилетий фундаментальные изменения в нашей экономике привели к тому, что миллионы работающих семей держатся на волоске. Заработная плата в основном стагнирует, несмотря на то, что прибыли корпораций растут, а производительность труда постоянно увеличивается. Доля национального дохода, идущая на оплату труда, сократилась и находится на самом низком уровне за последние почти 70 лет.
Эти тенденции отражают перемещение триллионов долларов из карманов работающих семей. И все они обусловлены одной основной проблемой: у американских рабочих недостаточно власти.
Эти тенденции отражают перемещение триллионов долларов из карманов работающих семей. И все они обусловлены одной основной проблемой: у американских рабочих недостаточно власти.
Это правда, что доля труда в национальном доходе снизилась с начала 1970-х годов. Но верно и то, что это падение слишком мало, чтобы объяснить расхождение между зарплатой и производительностью на графике EPI.
Взгляните еще раз на график EPI. Обратите внимание, что в заголовке говорится о "типичной компенсации работника". А если вы прочитаете мелкий шрифт, то увидите, что компенсация на графике указана только для производственных работников или работников без подчинённых. Другими словами, график EPI не учитывает компенсации менеджеров, многих профессиональных работников и так далее. Он также не учитывает самозанятых работников, которые, предположительно, также вкладывают определенный труд. Другими словами, график показывает производительность для всей экономики, но показывает оплату труда только для одного подмножества работников.
Простая теория заработной платы из курса Econ 101 предполагает, что существует только один тип работников. Но если вы измените ее, включив в нее два разных типа работников с двумя разными уровнями производительности, то в итоге вы получите два разных уровня заработной платы. И если вы попытаетесь соотнести заработную плату одного типа работников с производительностью обоих типов работников вместе взятых, вы увидите разницу. И эта разница может увеличиваться со временем, если производительность труда двух типов работников со временем расходится.
Что произойдет, если вы включите всех работников в числовые показатели оплаты труда? Линии становятся гораздо ближе друг к другу. У Джона Ван Ринена есть хорошая статья, показывающая, как меняется график, если посмотреть на медианную компенсацию (которая довольно близка к числу производственных/неконтролируемых работников на графике EPI) в сравнении со средней компенсацией (которая включает всех работников):

Неравенство - разница между медианной и средней зарплатой - более чем в два раза важнее, чем падение доли труда.
Фактически, EPI также имеет свою собственную разбивку, показывающую, какая часть расхождений в производительности и оплате труда на их графике обусловлена неравенством, а какая - падением доли труда:

Декомпозиция производительности - средняя почасовая оплата труда
Рост производительности, реальная средняя оплата труда (потребителей и производителей) и реальная средняя оплата труда, 1973-2019 гг.
На этом графике рост неравенства в оплате труда между работниками примерно в три раза важнее, чем падение доли труда.
Другими словами, график EPI - это в основном не график того, что корпорации утаивают деньги от рабочих. В основном это график того, что некоторые работники получают гораздо больше, чем другие. Это график неравенства в оплате труда.
Почему у одних работников зарплата выросла намного, а у других - совсем немного? На самом деле мы не знаем. Возможно, менеджеры и профессиональные работники имеют больше возможностей для ведения переговоров в корпорациях, чем работники низшего звена. Может быть, работники высшего звена стали гораздо продуктивнее благодаря развитию информационных технологий и индустрии знаний, а обычные рабочие стали менее продуктивны из-за упадка производства.
Но какова бы ни была причина, в данном случае речь идет не о соотношении капитала и труда. Это история о высокооплачиваемом труде и низкооплачиваемом труде.
Верно и то, что доля труда в доходах снижается, и это - скромная часть расхождений на графике. Но, объединив рост неравенства в оплате труда и снижение доли труда в единую "дивергенцию производительности и оплаты труда", EPI объединил эти два нарратива в одно число. А это не похоже на то, что их следует объединять. Может быть, они как-то связаны, а может быть, и нет.
Поэтому, хотя в данных EPI нет ничего плохого - производительность труда и зарплата производственных работников действительно разошлись, - я не думаю, что это очень наглядный способ представления фактов.* Вместо этого, я думаю, было бы разумнее просто показать две разные диаграммы:
*Некоторые из тех, кто пытается разоблачить график EPI, показывают графики, на которых зарплата и производительность труда идеально совпадают. Но чтобы получить такой результат, им приходится вносить другие сомнительные изменения - например, исключать из графика всю финансовую отрасль.
график, показывающий растущее неравенство в оплате труда, и
график, показывающий падение доли труда.
Показ этих двух графиков не означает, что мы меньше заботимся о среднем работнике. Но это позволило бы нам увидеть, что, вероятно, есть несколько разных вещей, причиняющих вред среднему работнику, а не только одна.
Урок заключается в том, что наша интерпретация графиков в значительной степени зависит от теории. Поэтому нужно очень внимательно изучить график, чтобы определить, какую теорию мы должны применить, чтобы попытаться понять его.
Пример 3: "График слона"
В конце 2010-х годов жители богатых стран пересмотрели взгляды на глобализацию. Отчасти это была реакция на победу Трампа в 2016 году, которую многие восприняли как бунт оставшихся в стороне работников обрабатывающей промышленности. В то время выходило множество исследований, показывающих, что "китайский шок" нанес ущерб значительной части американской рабочей силы и что в развитых странах растет неравенство. Нетрудно было сложить два и два и прийти к выводу, что глобализация помогла бедным слоям населения мира за счет бедных и среднего класса в таких странах, как США.
На самом деле, эта история могла бы быть правдой. Но в 2015 году Кристофер Лакнер и Бранко Миланович опубликовали график, который, казалось бы, наглядно демонстрировал эту историю. Он был назван "кривой слона":

Этот график показывает, что в период с 1988 по 2008 год - пиковые годы глобализации, включая "китайский шок" начала 2000-х годов - доходы среднего процентиля глобального распределения доходов сильно выросли, но стагнировали или даже упали для 75-85-го процентиля.
Многие люди, включая новостные издания и даже некоторых экономистов, сразу же определили "впадину" на графике слона как средний класс богатых стран. Вот что Люк Кава написал об этом графике для Bloomberg еще в 2016 году:
Глобализация стала мощным шоком для предложения рабочей силы, позволив корпорациям использовать более дешевую рабочую силу. Выгода для потребителей в странах с развитой экономикой выразилась в снижении цен на эти товары. Однако средний класс в развитых странах не смог увидеть, как этот прилив поднимает их лодки.
"Больше всего от глобализации проиграли (кроме самых бедных 5 процентов) или, по крайней мере, "не выиграли" те, кто находится между 75-м и 90-м процентилями глобального распределения доходов, чей реальный прирост доходов был практически нулевым", - утверждает Миланович. "Эти люди, которых можно назвать глобальным верхним средним классом, включают многих из бывших коммунистических стран и Латинской Америки, а также тех граждан богатых стран, чьи доходы стагнировали"...
Этот график сейчас муссируется на Уолл-стрит, когда стратеги ищут экономическое обоснование голосования на референдуме в Великобритании, успеха популистов в США и подъема сепаратистских движений в Европе, многие из которых носят изоляционистский характер.
"Больше всего от глобализации проиграли (кроме самых бедных 5 процентов) или, по крайней мере, "не выиграли" те, кто находится между 75-м и 90-м процентилями глобального распределения доходов, чей реальный прирост доходов был практически нулевым", - утверждает Миланович. "Эти люди, которых можно назвать глобальным верхним средним классом, включают многих из бывших коммунистических стран и Латинской Америки, а также тех граждан богатых стран, чьи доходы стагнировали"...
Этот график сейчас муссируется на Уолл-стрит, когда стратеги ищут экономическое обоснование голосования на референдуме в Великобритании, успеха популистов в США и подъема сепаратистских движений в Европе, многие из которых носят изоляционистский характер.
Но обратите внимание на то, что сам Миланович говорит об этом графике! К проигравшим он относит в первую очередь жителей Советского Союза и Латинской Америки. Он также упоминает "тех граждан богатых стран, чьи доходы стагнировали", но не уточняет, что эти граждане относятся к среднему или рабочему классу.
На самом деле оказывается, что американский средний и рабочий классы гораздо богаче, чем вы могли бы подумать. 60% населения США попадают в верхние 5% мирового распределения доходов. Только очень бедные американцы находятся в 75-85-м процентилях глобального распределения, где, согласно диаграмме Лакнера и Милановича, доходы стагнируют или падают.
А очень бедных американцев - или очень бедных европейцев, если уж на то пошло - не так уж много. Это означает, что большинство людей, оказавшихся во впадине "слоновьего" графика, жили в Советском Союзе, Латинской Америке и других странах с доходами выше среднего. Хоми Харас и Брина Зайдель внимательно изучили данные и подтвердили это:
На оригинальном "графике слона" только 36% населения, которое попадает в самую нижнюю часть впадины 80-84-го процентиля в 1988 году - которая была буквально выделена [в СМИ] как база Трампа - являются жителями США, Канады или Западной Европы. На самом деле, никто из этой группы населения не является жителем США; американский средний класс фактически находится в диапазоне от 90-го до 99-го процентиля глобального распределения. Наша работа подтверждает выводы других исследователей о том, что за последние два десятилетия эта группа относительно мало выросла. Вместо этого во впадине исходного графика находятся крупные группы населения из Японии, Восточной Европы и Латинской Америки. Потерянное десятилетие Японии и распад Советского Союза во многом объясняют медленный рост этой когорты.
Адам Корлетт провел собственное тщательное исследование данных и обнаружил то же самое, отметив, что средний и низший классы в развитых странах - за исключением Японии - на самом деле неплохо жили с 1988 по 2008 год, хотя и не так хорошо, как богатые:

Западные экономики в целом показали хорошие результаты по сравнению с другими странами (за исключением Китая), 1988-2008 гг.
Широко распространенное неправильное толкование графика слона не является - по крайней мере, насколько я могу судить - виной Лакнера и Милановича. Миланович большую часть своей карьеры оплакивал распад Советского Союза, так что, конечно, это должно было занять важное место в его рассуждениях. И в своей работе Лакнер и Миланович показывают, что большой удар по верхнему и среднему процентилям "слона" пришелся на 1988-1993 годы - не самое плохое время для неравенства на Западе и задолго до "китайского шока", но точно совпавшее с распадом СССР и экономическим крахом в Японии.
Но западный мир посмотрел на график слона и увидел то, что хотел увидеть: доказательство того, что глобализация подняла уровень бедных в мире только за счет вытеснения среднего класса в развитых странах, что привело к ответной реакции Трампа и Брекзиту. График стал вирусным, потому что он соответствовал политическому нарративу момента.
Как бы то ни было, с графиком слона есть множество других проблем. Главная из них заключается в том, что график измеряет изменения в доходах в каждой точке распределения, а не изменения в доходах людей, которые начинают жить в каждой точке распределения. Это очень разные вещи. В богатых странах наблюдался приличный рост доходов, но темпы роста населения были медленнее, чем в остальном мире, а это значит, что они оказывались втиснутыми на более низкий и высокий уровень распределения. Если переделать график слона, оставив неизменной начальную точку распределения людей, то он совсем не похож на слона - рост глобального дохода был гораздо более равномерным, чем считают Лакнер и Миланович. Возможно, это одна из причин, по которой вы больше не увидите, чтобы многие экономисты говорили о графике слона.
Но как бы то ни было, случай с графиком слона показывает еще один большой подводный камень при интерпретации вирусных графиков: инстинкт подгонки графиков под желаемый политический нарратив.
Пример 4: график "политического компаса"
Раз уж мы заговорили о политических нарративах, давайте поговорим о политологическом графике.
После выборов 2016 года много мыслей и энергии ушло на анализ причин победы Трампа. Фонд демократии запустил очень большой углубленный опрос тысяч американцев под названием VOTER (Views Of The Electorate Research) Survey. Эта аббревиатура не слишком оптимизирована для поисковых систем, которые не учитывают регистр букв. Но сам опрос выглядит довольно хорошо - тщательно проведен, большой размер выборки и так далее.
Ли Друтман хорошо описал некоторые результаты исследования. Самым известным его выводом, безусловно, стала эта диаграмма:

На графике видно, что в американском политическом спектре есть большое пустое пространство - нижний правый квадрант. В этом квадранте представлены люди, которые консервативны в экономических вопросах, но либеральны в социальных вопросах - в общем, классические либертарианцы.
Тот факт, что этот квадрант в основном пуст, сказал многим аналитикам, что либертарианцы - или люди, которые называют себя "социально либеральными, но финансово консервативными" - практически не существуют среди американского электората. Например, левоцентрист Джонатан Чейт написал:
Либертарианцев не существует... Ну, очевидно, они существуют - просто не в достаточно большом количестве, чтобы сформировать электорат. Отсутствуют не только убежденные либертарианцы. Даже избиратели, смутно относящиеся к либертарианству, функционально не существуют... Четвертый квадрант, социально либеральный/экономически консервативный, пуст...
У либертарианского движения много денег и мощная поддержка активистов и интеллектуалов, что позволяет ему быть намного выше своего веса. Либертарианские издания, такие как Reason, регулярно выпускают полемику и исследования, призванные показать, что либертарианство - это новый огромный тренд и волна будущего. Иногда основные новостные организации покупаются на то, что они продают. Но правда заключается в том, что в американской политике недопредставленная когорта - это полная противоположность либертарианцам: люди с правыми социальными взглядами, которые поддерживают большое правительство в экономике.
У либертарианского движения много денег и мощная поддержка активистов и интеллектуалов, что позволяет ему быть намного выше своего веса. Либертарианские издания, такие как Reason, регулярно выпускают полемику и исследования, призванные показать, что либертарианство - это новый огромный тренд и волна будущего. Иногда основные новостные организации покупаются на то, что они продают. Но правда заключается в том, что в американской политике недопредставленная когорта - это полная противоположность либертарианцам: люди с правыми социальными взглядами, которые поддерживают большое правительство в экономике.
Отсюда следует, что демократы должны сосредоточиться на привлечении избирателей в верхнем левом квадранте - людей, которые социально консервативны, но любят большое правительство, - трубя о своих хлебных и насущных проблемах и сбавляя обороты. В принципе, это то, что могли бы посоветовать Дэвид Шор или Джон Феттерман.
Но хотя это может быть хорошей стратегией, сомнительно, что график Друтмана действительно показывает это. В своем посте для Niskanen Center Карл Смит показал, что вывод сильно зависит от того, где вы проводите края графика:
Чем больше я вглядывался, тем более странным казался этот график. Дело не только в том, что правый нижний квадрант пуст. Точки на верхнем и левом концах диаграммы слились воедино. Они не исчезают постепенно, как это обычно бывает с данными. В верхней и левой частях графика масса больше, чем в других квадрантах. Такая картина говорит о том, что данные были значительно усечены. То есть некоторые люди получили бы больше 1 балла за социальный консерватизм, а многие - меньше -1 балла за экономический либерализм. Однако процедура подсчета баллов не позволила этого сделать. Вместо этого она обрезала этих избирателей до максимально допустимых значений 1 и -1, соответственно.
Из этого следует, что 0,0 на этом графике - не только ложный центр масс, но и не центр диапазона мнений... Похоже, что вопросы оценивались так, что крайние крайне правые мнения отмечались как +1, а относительно левоцентристские - как -1.
Из этого следует, что 0,0 на этом графике - не только ложный центр масс, но и не центр диапазона мнений... Похоже, что вопросы оценивались так, что крайние крайне правые мнения отмечались как +1, а относительно левоцентристские - как -1.
Смит пробует сдвинуть оси немного в сторону либерального конца шкалы "проблем идентичности" и обнаруживает, что распределение выглядит гораздо более симметричным:

Небольшой перекос все еще присутствует, но большая часть поляризации теперь проходит по диагонали - между людьми, которые одновременно являются социально и экономически либеральными, и людьми, которые одновременно являются социально и экономически консервативными.
Возможно, американский электорат просто очень прогрессивен по социальным вопросам, поэтому перемещение осей таким образом, как это сделал Смит, является просто фальсификацией данных. Но стоит отметить, что другие исследования показывают гораздо более симметричное распределение. Например, в 2015 году Нейт Сильвер изучил данные General Social Survey - большого и часто повторяющегося углубленного опроса - и обнаружил, что если использовать перераспределение доходов как косвенный показатель экономических ценностей, а однополые браки - как косвенный показатель социальных ценностей, то в 2010-12 годах распределение выглядело довольно равномерным между "либертарианцами" и "hardhats"*
*hardhats - те, кто за перераспределение доходов, но против гей-браков в этом контексте
- прим. Holy Finance

Здесь ось Y перевернута относительно предыдущих графиков и "социально либеральные" здесь сверху
Другими словами, это похоже на еще один случай, когда вирусная диаграмма была привязана к определенному политическому нарративу, в который люди хотели верить. На самом деле, этот нарратив не сильно отличается от того, который заставил график слона стать вирусным - желание демократов обратиться к "hardhats".
Правильно ли это повествование или нет, конечно, совсем другой вопрос.
Нарративы сложнее, чем данные
В общем, есть три причины, по которым вирусная диаграмма может сбить вас с пути:
Данные могут быть плохими.
Данные могут быть представлены в искаженном виде.
Вы можете интерпретировать данные так, чтобы поддержать нарратив, который данные не поддерживают.
Третий из этих вариантов поймать сложнее всего. Вы - человек, а люди - не машины, ищущие истину. Кроме правды, мы хотим получить от данных много других вещей. Мы хотим чувствовать, что понимаем мир. Мы хотим чувствовать, что многие наши собратья согласны с нами. Мы хотим чувствовать, что то, что хорошо для мира, хорошо и для наших собственных карманов и социального статуса. И так далее.
Вот почему выявление проблем с вирусными графиками - или с популярными нарративами, связанными с этими графиками, - может быть такой удручающей и неблагодарной работой. Было бы очень хорошо, если бы мир был таким же простым, как экономические истории, которые преобладали в США в 2010-х годах. Но все не так просто, и никогда не было. Борьба со сложностями может быть болезненной, но именно это даст нам возможность более эффективно перестраивать мир в 2020-х и последующих годах.
Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Жалоба
