10.01.2022

Статистика для жизни: зачем повышать статистическую грамотность

Мы привыкли, что статистика — это всегда про сложные социально-экономические процессы и математические модели. Но статистика, если совсем немного в ней разобраться, может оказаться крайне полезным инструментом и в обыденной жизни, который поможет сэкономить и не дать себя обмануть. Доцент факультета экономических наук НИУ ВШЭ Елена Вакуленко рассуждает о том, на что способна статистика и почему иметь о ней представление важно каждому человеку.

 

На шаг впереди

Статистика — это комплексный термин, который включает в себя очень многое: и сбор информации, и оценивание на её основе различных показателей, и исследование закономерностей (когда мы пытаемся выяснить, как связаны те или иные переменные). Статистика может пригодиться там, где собираются данные, а данные сейчас собираются практически везде, и с их помощью можно добиться удивительных результатов.

Чтобы продемонстрировать потенциал анализа статистических данных, приведу пример из книги Чарльза Уилана «Голая статистика» об американской сети магазинов розничной торговли Target. Компания поставила перед собой задачу лучше понять поведение своих клиентов, чтобы тем самым повысить прибыль, и стала изучать не просто, какие товары покупают люди, а кто их покупает. Когда в магазине вы приобретаете бонусную карту, вы подписываетесь на то, что магазин будет изучать ваше поведение. Некоторые просят еще заполнить небольшую анкету, чтобы больше знать о том, что за люди покупают их товары.

В частности, в Target выяснили, что беременные женщины вырабатывают долговременные отношения с определённой розничной сетью — привыкают ходить в одни и те же магазины — и решили привлечь эту категорию покупательниц к себе. Сначала компания определила товары, которые чаще всего покупают беременные женщины: одежда для беременных, ватные тампоны, витамины, неароматизированные лосьоны и так далее. Затем на основе этих данных попробовала выявить среди своих покупательниц женщин в положении. То есть если женщина покупает что-то из выделенных товаров, то, как предположили в Target, она с большой вероятностью беременна. Затем компания постаралась привлечь этих женщин в свои магазины с помощью скидочных купонов на товары для беременных и стала рассылать их по домам клиенток в надежде сделать их постоянными покупательницами Target.

И произошла следующая казусная ситуация, о которой даже написала газета «Нью-Йорк таймс». Житель Миннеаполиса стал регулярно находить в своём почтовом ящике скидочные купоны на вещи для беременных. У мужчины была жена и дочь, которой ещё не исполнилось 18. В какой-то момент мужчина, в очередной раз обнаружив в почтовом ящике эти купоны, взбесился и обратился в Target с жалобой, что те подталкивают его несовершеннолетнюю дочь завести ребёнка. Но оказалось, что его дочка действительно была беременна, и статистики Target узнали об этом раньше, чем отец девушки.

 

Предсказать кризис или обмануть

Статистику можно использовать и во зло, и во благо. Например, в медицине статистика позволяет понять, помогают ли лекарства, в маркетинге — выяснить, как расставить продукты на полках так, чтобы они лучше продавались, в экономике — предсказать кризис. Но статистические данные также можно использовать недобросовестно и, например, манипулировать с их помощью общественным мнением.

На одни и те же данные можно посмотреть по-разному. Один человек скажет: «Наша система школьного образования деградирует. 60% школ в этом году продемонстрировали результат хуже прошлогоднего». А другой ответит: «Нет, наша система школьного образования развивается. 80% учеников в этом году продемонстрировали результат лучше прошлогоднего». Эти два высказывания на самом деле друг другу не противоречат, просто в школах разное количество учеников, и в первом случае это учли, а во втором — нет. То есть в зависимости от того, на какие показатели вы смотрите и какая часть данных вам по тем или иным причинам выгодна, можно предоставить разные выводы.

Зачастую искажения в данные вводятся игнорированием инфляции. Например, в этом замечены голливудские киностудии, которые сравнивают доходы от разных фильмов в разные периоды времени. В 2011 году на внутреннем рынке США самым кассовым фильмом за всю историю кинематографа был назван фильм «Аватар» (2009). Но авторы рейтинга оценили кассовые сборы по номинальным показателям, то есть по курсу доллара года выхода фильма (Уилан, 2016). Если учесть различия в ценах, то самым кассовым на тот момент окажется фильм 1939 года «Унесённые ветром». Возможно, что авторы рейтинга хотели создать у нас впечатление, что каждый новый фильм прибыльнее и грандиознее предыдущего.

Важно всегда спрашивать, как был получен тот или иной показатель. Статистика очень часто использует так называемые агрегированные показатели, выведенные на основе нескольких более «простых» показателей. В этом смысле статистика — это некоторое упрощение действительности, как и математические модели. Но оно необходимо, когда нам нужно увидеть общую картину и за множеством разных показателей понять, куда мы движемся. Например, есть отдельно уровень заработной платы и безработицы, а есть показатель качества жизни в стране. Агрегированные показатели рассчитываются по определённой методологии, которая, и об этом тоже важно помнить, может меняться. Это стоит обязательно учитывать при анализе данных.

 

Статистика для жизни

Статистика — это важный инструментарий, который необходим как в профессиональных областях, так и в повседневной жизни. Люди без специальных знаний могут не разбираться в том, что такое, например, индекс потребительских цен или инфляция, но каждому будет важно понять, что он может купить в магазине на фиксированную сумму. Вот раньше я на тысячу рублей мог такой набор продуктов купить, сейчас — другой, а завтра что я смогу купить на эту тысячу? В этом случае знания статистики могут помочь правильно спланировать свой бюджет.

Или, скажем, выбираете вы для своего ребенка школу и смотрите на её рейтинг. А из каких показателей он складывается? Если учитываются, например, характеристики учеников, которые идут в ту или иную школу, то на входе образуется барьер. То есть в лучших школах будут учиться лучшие ученики, и тогда, может, стоит обратить внимание на показатели учителей. Пусть на входе ученики будут не самые сильные, но зато учителя хорошие.

Ещё очень часто путают проценты и процентные пункты. Прочитают в новостях, что уровень безработицы вырос с 3 до 5%, и делают вывод, что безработица выросла на 2%. Но это именно процентные пункты, и если подсчитать, то окажется, что выросла безработица не на два, а на 66%. 

Знание основ статистики может помочь человеку вовремя задать правильные вопросы и, таким образом, не дать себя обмануть. Предположим, покупаем мы себе новый шампунь от перхоти и читаем на упаковке: «Работает в 90% случаях». Кажется, здорово, но надо спросить, а кто этот шампунь проверял? Дальше под звездочкой мелким шрифтом читаем: «Проверили 10 человек». Задумываемся и понимаем, что выборка не очень репрезентативная. Или слышим, как в новостях говорят: «По результатам опроса, 80% россиян довольны своей жизнью». Надо обязательно задуматься, а кого спрашивали? Как спрашивали — на бегу по дороге на работу или за чашечкой кофе в ресторане? Где спрашивали — на Красной площади или на станции метро «Выхино»? Ко всем цифрам нужно стараться относиться критично и задавать подобные вопросы.

 

Как повысить статистическую грамотность

Для тех, кто хочет освоить основы статистики, есть множество бесплатных курсов на платформах онлайн-образования: Coursera, Skillbox, Открытое образование и другие. Здесь важно обращать внимание не только на преподавателей курсов, но ещё и на то, на кого они рассчитаны — на экономистов и математиков или на людей без математической базы. 

У меня на платформе «Открытое образование» тоже есть свой курс — «Количественные методы анализа экономики». Изначально я создавала его для студентов непрофильных специальностей, то есть не для экономистов, поэтому он подойдет для тех, кто совсем не знаком со статистикой и математикой, но хочет освоить основы. Идея моего курса в том, чтобы дать те знания, которые будут применимы на практике. Например, людям интересно понять, от чего зависит их зарплата. Стоит ли сначала пойти отучиться пять лет или лучше сразу идти работать и нарабатывать опыт? И дальше мы вместе разбираем все влияющие факторы, конструируем модель и оцениваем.

Также для начинающих я бы посоветовала несколько хороших научно-популярных книг. Мне очень нравится «Голая статистика» Чарльза Уилана, которую я уже упоминала. В ней совсем мало формул и очень много примеров из жизни, случаев, с которыми мы все сталкиваемся и в которых могут пригодиться знания основ статистики. Ещё одна подобная книга — «Как лгать при помощи статистики» Дарелла Хафа, тоже очень познавательная. 

Если хочется не просто повысить свою статистическую грамотность, но ещё научиться находить взаимосвязи между переменными, то подойдёт «Практика эконометрики: классика и современность» Роберта Берндта. В этой книге сначала приводится экономическая задача, а потом способ её решения. Еще одна книга — «Статистика для менеджеров с использованием Microsoft Excel» Д.М. Левина и др. В ней также собраны интересные и понятные примеры, а Microsoft Excel как раз подойдёт для тех, кто пока не готов перейти к продвинутым программа вроде R или Python. 

Это, разумеется, далеко не полный список, но неплохое начало. А тех, кто хочет знать больше о статистике, методах анализа данных в экономике, я приглашаю на образовательные программы факультета экономических наук НИУ ВШЭ.

В целом мне бы хотелось, чтобы основы статистики были включены в школьные и университетские программы не только профильных специальностей. Иметь хотя бы общее представление о статистике крайне полезно, чтобы уметь анализировать, задавать вопросы и не позволять собой манипулировать. 

 

Список литературы

  1. Берндт Э.Р. Практика эконометрики: классика и современность. М.: ЮНИТИ-ДАНА, 2005. 863 с.
  2. Левин Д.М., Стефан Д., Кребиль Т.С., Беренсон М.Л. Статистика для менеджеров с использованием Microsoft Excel. 4-е изд.  М.: Вильямс, 2004. 1312 с.
  3. Уилан Ч. Голая статистика. Самая интересная книга о самой скучной науке. М.: Манн, Иванов и Фербер, 2017. 352 с.
  4. Хафф Д. Как лгать при помощи статистики. М.: Альпина Паблишер, 2018. 163 с.

Читайте также

Загрузить еще